Gene Cag_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1046
Symbol
ID	3747774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1414240
End bp	1415802
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	33%
IMG OID	637773575
Product	hypothetical protein
Protein accession	YP_379351
Protein GI	78189013
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000103678
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCGC TACCCGTAGG CATACAAACA TTTAGTAAAA TAATCGAGGA CGATTATCTG 
TACATTGATA AAACAGATAT AGCAAAAAGC ATAATAGAAA AATATCAATA TGTTTTTCTA 
TCACGTCCAC GACGATTTGG TAAAAGCTTA TTTCTTGATA CCCTTAAAAA TATTTTTCTT 
GGCAATAAAG AGCTATTCCA AAACTTACAT ATTTATAACC AATGGAATTG GAATATAACC 
TATCCTGTTA TTAAAATAAG TTTTAGTGGC GGAATACGAA ATAACGAAAG TCTTCGCAAA 
AATCTTTTTT ATATCCTAAA AGATAATCAA AAACGGCTCA ATATTACTTG TGAAGAAAAC 
GATGAGCCAA ATCTATGCTT TGCTGAATTG ATTCAACAAG CATTTGAAAA ATACCAACAA 
AAGGTTGTTA TTCTGATTGA CGAGTATGAT AAACCTATTC TTGATAATAT TGAAAACATT 
CCTGAAGCAC TCGTTATTCG TGATGGAATG CGTGATTTTT ATACCAAAAT AAAAGAGAAC 
GATGAATATT TGCGTTTTGT ATTTCTAACA GGAGTAAGCA AGTTTTCAAA AGTATCGCTC 
TTTAGTGGTT TAAATAATCT TGAGGATATT AGCCTGAACC CTAATTTTGG CAACATTTGT 
GGCTATACAC AGCATGATGT TGATACTGTT TTTGCACCAT ATCTTGAAGG TGTGGCTATG 
GAGAAAGTAA AGCGCTGGTA TAATGGATAT AATTTCTTGG GCGATAACGT TTATAATCCA 
TTTGATATTT TACTTTTTAT AAAAAACCAA AAGACGTTTA AGAATTATTG GTTTGAAACG 
GGCACACCAA CCTTTTTAAT GAAGCTTTTT GCTAAGGAGC GCTATTTTTT ACCCAATTTA 
GAGCACCTTG AAGTGGGTGA TGAAATTCTT GATTCATTTG ATATTGAAAA AATTCAACTT 
GCAACTCTTT TATTTCAAAC GGGATATTTA ACCATAGAGA AACGGTTTGA AACGTTTGAG 
CGATTACGTT ACCAACTTAA AATCCCTAAT CAAGAGGTTC GTTTAGCGTT AAGTGATCAT 
TTTATTAATG TTTATACCGA GCAGCCGAAT GAGTTAAAAT ATGCCCAGCA AAATCGTTTT 
TATACCTATT TAACGCAGGT TGATATGCTT GGTTTCCAAC AAACGTTGCA AGCATTATTT 
GCCGGCATAC CGTGGAATAA TTTTATCAAT AACTCGTTGC CTGAGTTTGA AGGCTATTAT 
GCAAGTGTAC TGTATGCTTT TTTTATTAGT CTTAATGCTA CAGTTATTCC TGAAGATACC 
ACCAATCAAG GGCAGGTTGA TTTAACAATA ATGGTTGAAA ACAAAGTTTA CATTATTGAA 
ATTAAACGTG ATACGGTAAA AAGCTATGAA ATAAGCCAAC AAAACATAGC TCTGCAACAA 
ATTCAGAGAA AAGGTTACGC CACAAAATAT AAAGGGCAAG GGAAAACAAT TATACAAATT 
GGCATGATTT TTAACATCTA TCAGCGCAAT CTTGTACAAA TGGATTGGGA GGTTGTGGGG 
TGA

Protein sequence

MKPLPVGIQT FSKIIEDDYL YIDKTDIAKS IIEKYQYVFL SRPRRFGKSL FLDTLKNIFL 
GNKELFQNLH IYNQWNWNIT YPVIKISFSG GIRNNESLRK NLFYILKDNQ KRLNITCEEN 
DEPNLCFAEL IQQAFEKYQQ KVVILIDEYD KPILDNIENI PEALVIRDGM RDFYTKIKEN 
DEYLRFVFLT GVSKFSKVSL FSGLNNLEDI SLNPNFGNIC GYTQHDVDTV FAPYLEGVAM 
EKVKRWYNGY NFLGDNVYNP FDILLFIKNQ KTFKNYWFET GTPTFLMKLF AKERYFLPNL 
EHLEVGDEIL DSFDIEKIQL ATLLFQTGYL TIEKRFETFE RLRYQLKIPN QEVRLALSDH 
FINVYTEQPN ELKYAQQNRF YTYLTQVDML GFQQTLQALF AGIPWNNFIN NSLPEFEGYY 
ASVLYAFFIS LNATVIPEDT TNQGQVDLTI MVENKVYIIE IKRDTVKSYE ISQQNIALQQ 
IQRKGYATKY KGQGKTIIQI GMIFNIYQRN LVQMDWEVVG