Gene Cag_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0104
Symbol
ID	3747592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	118404
End bp	119819
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	49%
IMG OID	637772630
Product	Elongator protein 3/MiaB/NifB
Protein accession	YP_378425
Protein GI	78188087
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.016324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAC ATGTAAAAAA AGTGGCGTTA GTTTTTCTCC CCTCAGAAAG CGGTGTTGAC 
GGCGCTCGTT CACTTTATGC AAACAAAGCG GCACAGCACC CGCTTAAAGA GTGGGCAAAC 
AACGCGTTTC GTGGCATTAT TAAACGAAGC CAATTTGCCA TTCCCCCGCT TTCGTTGATG 
ATTCTTAGCT CACTTGAAGT AGCAGGTGTC CAGCAAGTGA TCTGCGATCT CCGCTTTGAG 
GATTTTGATT TTGAAATGAA GTGGGATTTA GTGGGCATTA GCGTCCAAAG TGGCATGGCT 
CGCAAAGCCT TTGAGCTTGC TGATGCGCTT CGTGCGAAAG GAATAAAAGT AGCGCTTGGC 
GGTGCCCATG TAACCCTTTT CCCTGAAAGC TGCCAACCTC ATGCGGATGT TTTGGTGCCC 
GGTGAAGCCG ATGAAGTGTG GGAAGAGGCG TTGCGCGATC TTGTAGCGAA TAGGCTCCAA 
CCACTTTACC GTGCCGAAAG CTTCCCAAAC CTTCAGCACG CCCGTCCCGT TAGCAAACAA 
GCGTTACAAC CCGAACGCTA CTTTACCACC AATTTGATAC AAACAGGACG AGGCTGCCCA 
TACAACTGCG ACTTTTGCAA TGTTCACGTC TTGAATGGGC ACACCTTGCG CCAACGCCGT 
ATTACCGATG TAGTGCAAGA AGTTGCTCGC TTTCAACAAG ATGATCAGCG CATTTTCTTT 
TTTGTTGACG ACTCCATCAA TGCTGATCCC GCTTACGCCT TAGAGCTTTT TCAATCCCTG 
ACTCCCCTTA AAATCCGTTG GTTTGGGCAA GCCACTACCA CCTTAGGGCA GCAGCACGAA 
CTCCTTAGCG CCTTTGCCGA CTCAGGCTGC CAAGCATTAT TGGTTGGCAT TGAAAGTATT 
GAGAACGCCA GCCGCACAGC CCACGCTAAA CAGCAAAACC GTGCAAACGA GTTAGTGAGC 
GCCATAACCA CCATTCGCCA AGCAGGCATT AGCCTTTACG GCAGCTTTAT TTATGGACTT 
GATGGCGACA CCCTCGAAAC ACCCGCTGCA ATTTTAGATT TTGTAGCACA AACAAAACTT 
GATGTACCCG GCATTAACAT TTTACGCCCA ACCCCAGGCA CCCGCGTTTT TGAACGCCTC 
CGCAACGAAG GACGCTTACT GTTTGACCCA AATGATGTAA CAGCATACCG CTACTCTTTT 
GGACAAGAAA TGCTCTATCG CCCAAAAAAC ATTCCACTTG ACGACTTTAT TGAAAGCTAT 
AGCCAACTAA CACGCACTCT TTTTTCATGG CAAAACGCCG TTAAACGAGG ATTAAACGCC 
CCACGAGCAA AAAGCGCCGT CCTGCTTTTT AACCTCTTCT ATAGCCACCT TTACACCCTC 
TCGCGCAACG ACCTGCAAGC ACAAAAACTA TCGTAA

Protein sequence

MAEHVKKVAL VFLPSESGVD GARSLYANKA AQHPLKEWAN NAFRGIIKRS QFAIPPLSLM 
ILSSLEVAGV QQVICDLRFE DFDFEMKWDL VGISVQSGMA RKAFELADAL RAKGIKVALG 
GAHVTLFPES CQPHADVLVP GEADEVWEEA LRDLVANRLQ PLYRAESFPN LQHARPVSKQ 
ALQPERYFTT NLIQTGRGCP YNCDFCNVHV LNGHTLRQRR ITDVVQEVAR FQQDDQRIFF 
FVDDSINADP AYALELFQSL TPLKIRWFGQ ATTTLGQQHE LLSAFADSGC QALLVGIESI 
ENASRTAHAK QQNRANELVS AITTIRQAGI SLYGSFIYGL DGDTLETPAA ILDFVAQTKL 
DVPGINILRP TPGTRVFERL RNEGRLLFDP NDVTAYRYSF GQEMLYRPKN IPLDDFIESY 
SQLTRTLFSW QNAVKRGLNA PRAKSAVLLF NLFYSHLYTL SRNDLQAQKL S