Gene Cag_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1941
Symbol
ID	3746701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2472805
End bp	2473806
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	50%
IMG OID	637774476
Product	Elongator protein 3/MiaB/NifB
Protein accession	YP_380232
Protein GI	78189894
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2896] Molybdenum cofactor biosynthesis enzyme
TIGRFAM ID	[TIGR02666] molybdenum cofactor biosynthesis protein A, bacterial

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATGAGC CGTATGCCAC AAGCCAACCG CTTTTTGATA CGTTTCAACG CCAAATAACG 
TATGCGCGCT TAGCGGTTAC CTCAGCTTGT AACTTGCGCT GCGGCTACTG TTTAAGCGAA 
GCGCACGAAC CCGCTACACT GCACCAACCA CTTCTTTCAA CGGCTGAACT TTGCACCATT 
ATTGAGTTGC TTGCCAAGCA TGGCATTCAA AAGCTACGCT TCACGGGTGG AGAACCCTTA 
CTGCGTAGCG ATATTGTAGC GCTTATTGCT ATGGCACGGC AGCACTCATC CATTCGCACC 
ATTGGCTTAA CGACGAACGG CTTGTTGCTT CTTCCCCTTC TCCCTCGTTT ACTTGACGCT 
GGGCTTGACT CGGTAAATCT TAGCCTCGAT ACACTCAATC GCCATCGTTA CTTTCAAATT 
ACTCGGCGCG ACCTTTTTCC GCAAGCTGAA GCGGCGTTGC ATGCGCTACT GGCTACACCC 
TCGCTTTCAG TAAAATTGAA CGTGGTTATG CTGCGTGGCA TTAATAGCGA TGAACTTACT 
GGCTTTGTAG AGCTTACCAA AGAGCATAAC ATCACTGTGC GCTTTTTAGA GCTGCAACCC 
TTTGACGACC ATCAAATTTG GAAGACAGGG CGCTTTTTGC GAGCTGATCG GCTTGAAGAG 
ATGTTGCTGC ACGCTTATCC CGCTTTGCAG CGCGTGCAAG GCGAAGCAAC CCAGCACTTT 
AGCTATTGTT TGTCCAACTA CAAAGGCGCA CTTGCAATTA TTCCCGCTTA CACAAGAGCA 
TTTTGCGAGC AATGCAACCG CTTACGTATT ACCTCAAGCG GCAAGCTGAT AAGTTGCTTG 
TATGAAAAGG ATGGATTAGA ACTTTTACCC TTGTTGCGAA ATGGTGCAAA ACCCGAAGAG 
TTTGCGGCGT TGTTGCAGCA AGCCGTGCTT CGTAAACCAG CCAACGGGCA TCAGCGCCAC 
ACAGGTGCTG TGCGTACCAG TATGTCGGAG ATTGGGGGGT AA

Protein sequence

MDEPYATSQP LFDTFQRQIT YARLAVTSAC NLRCGYCLSE AHEPATLHQP LLSTAELCTI 
IELLAKHGIQ KLRFTGGEPL LRSDIVALIA MARQHSSIRT IGLTTNGLLL LPLLPRLLDA 
GLDSVNLSLD TLNRHRYFQI TRRDLFPQAE AALHALLATP SLSVKLNVVM LRGINSDELT 
GFVELTKEHN ITVRFLELQP FDDHQIWKTG RFLRADRLEE MLLHAYPALQ RVQGEATQHF 
SYCLSNYKGA LAIIPAYTRA FCEQCNRLRI TSSGKLISCL YEKDGLELLP LLRNGAKPEE 
FAALLQQAVL RKPANGHQRH TGAVRTSMSE IGG