Gene Cag_0400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0400
Symbol
ID	3747778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	464414
End bp	465523
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	49%
IMG OID	637772928
Product	chlorophyllide reductase iron protein subunit X
Protein accession	YP_378716
Protein GI	78188378
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1348] Nitrogenase subunit NifH (ATPase)
TIGRFAM ID	[TIGR02016] chlorophyllide reductase iron protein subunit X

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0534457
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAA GAACCATAGC GATTTACGGC AAAGGTGGAA TAGGTAAAAG CTTTACCACC 
ACCAATCTTA GCGCCACCTT TGCCAGGATG AATAAGCGCG TGCTTCAGCT TGGTTGCGAT 
CCCAAACACG ACTCCACCAC CTCGCTGTTT GGCGGCATTT CGCTGCCAAC CGTAACCGAT 
GTGTTTGCGG CAAAAAATGC TAAAAACGAG CAAGTAGCCA TTAGCGACAT TGTTTTTCGC 
CGCGATATTG AAGGCTTTCC TCAACCAATT TATGGCATTG AACTTGGCGG TCCACAAGTT 
GGGCGCGGTT GCGGTGGACG CGGCATTATT TCAGGTTTTG ATGTGCTTGA AAAGCTCGGC 
ATGTTCCAAT GGGATATTGA TATTATTCTT ATGGATTTTC TGGGCGATGT AGTGTGTGGA 
GGTTTTGCAA CGCCGCTTGC CCGCTCACTT AGCGAAGAGG TAATTCTTGT AACCAGCAAC 
GATCGTCAAG CTATTTTTAC AGCGAACAAC ATCTGCCAAG CAAATAACTA CTTCCGCACC 
ATTGGCGGTG AATCGCACCT GCTTGGTATG ATTATCAATC GTGATGATGG TAGCGGTGTT 
GCTGAAAACT ACGCACAAGC CGCAGGCATT AACGTGCTGA TGAAAGTGCC CTACAACATG 
GAGGCACGCG ACCGCGATGA CAGCTTCGAC TTTGCTATAA AACTCCCCGA GCTTCGCGAC 
AAATTCCAAA AGCTTGCAAC CGATATTCTT GAAAAGCGCA TTGCCCCCAG CAACGCCACA 
GGGCTTGATT TCAACGACTT TGTGCGCCTT TTTGGCGACG TGAAAAACGA AGCGCCTCGT 
CCCGCTAAAG CCGATGAGCT TTTTGCATCA CAACCCGCAG GCAACAACGC ATCCACCACC 
ACTCATTCTA CCCAAGAGAG CGACCAGCAA AAAATGGAGC GCTGCATCGC TTGTCTTGAA 
CCCATCCAGC AACAACTTTA CCGCCTCGCT GAGCTTGAGA AAAAAAGCCT CACCGACATT 
GCATCCCTTA CCAATCTTGA CGAAACCACC ATCAGCGAAA CGCTTACACG CGCCCGCAAA 
CAGCTCAAAC GCATGTTTTT TGAGGGATAA

Protein sequence

MKARTIAIYG KGGIGKSFTT TNLSATFARM NKRVLQLGCD PKHDSTTSLF GGISLPTVTD 
VFAAKNAKNE QVAISDIVFR RDIEGFPQPI YGIELGGPQV GRGCGGRGII SGFDVLEKLG 
MFQWDIDIIL MDFLGDVVCG GFATPLARSL SEEVILVTSN DRQAIFTANN ICQANNYFRT 
IGGESHLLGM IINRDDGSGV AENYAQAAGI NVLMKVPYNM EARDRDDSFD FAIKLPELRD 
KFQKLATDIL EKRIAPSNAT GLDFNDFVRL FGDVKNEAPR PAKADELFAS QPAGNNASTT 
THSTQESDQQ KMERCIACLE PIQQQLYRLA ELEKKSLTDI ASLTNLDETT ISETLTRARK 
QLKRMFFEG