Gene Cphamn1_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0937
Symbol
ID	6374604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	1014004
End bp	1015122
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	50%
IMG OID	642683439
Product	chlorophyllide reductase iron protein subunit X
Protein accession	YP_001959363
Protein GI	189499893
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1348] Nitrogenase subunit NifH (ATPase)
TIGRFAM ID	[TIGR02016] chlorophyllide reductase iron protein subunit X

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACAC CTCGCACAAT TGCCATTTAT GGAAAAGGCG GTATAGGAAA AAGCTTCACG 
ACAACCAACC TCAGCGCTAC ATTCGCGCTT ATGGGAAAAA GAGTGCTACA GCTTGGCTGT 
GACCCTAAAC ACGATTCAAC AACGTCGCTT TTTGGCGGCG TCTCGCTGCC GACCGTCACA 
GAAGTGTTCG CAGAAAAAAA TGCCCGCAAC GAAGAGCTGC AAATCAGCGA CATCGTCTTC 
AGGAGAGATA TACCGGATTT TCCGCAACCG ATCTATGGCG TTGAACTCGG CGGGCCGCAG 
GTTGGAAGAG GGTGCGGAGG CAGAGGCATT ATATCCGGTT TTGACGTACT GGAAAAATTA 
GGCCTGTTTT CCTGGGACCT GGATGTCATT CTGATGGATT TCCTTGGAGA CGTCGTCTGC 
GGAGGTTTCG CAACGCCTCT TGCCCGCTCC CTGAGTGAGG AAGTGATACT GCTTACAAAC 
AACGACCGTC AGTCGATTTT CACCGCAAAC AATATCTGCC AGGCAAACAA CTACTTCAAG 
ACCGTCGGTG GAGAGTCAAA ACTGCTCGGG CTCATTATCA ACCGGGACGA CGGTAGCGGC 
ATTGCAGAAA AGTACGCTGC TGAGGCAGGA ATCACTATCC TCATGAAACT GCCGCATAAC 
ACCGCGGCGA GAGACAAGGA CGACAGTTTC GATTTTGCCG TCCGTCTTCC TGAAATCGGA 
GAACCGTTCC GCAAACTCGC CACTGATATT CTTGAAAGAA AAATAACACC CTGTGAAGCT 
GCAGGACTTG ATTTTCAGAC ATTTATCCGC CTTTTCGGAG AGGTAAACGA AGCTCACCCG 
ACCCCGGCGT CCCAAGATGA ATTAACCGGT CAAAAACAAC AGATCAACGG CGAGAGGCCC 
GAAGCGGCAC AAAACGATTC AGTTTCACCT GAAAGCGAAA AACTGTTTGC CTGCATTGAA 
AAACTCCCTG ATTCCGAAAA GGAAATCTAC CGCTTGATCG AGGTGGAGAA AAAAAGCGCT 
GCGGAAGCAG CCGGAATAAA GGGGATCAGC GAAGCAGAGG CACAGGAAAT TTTTTCTTCA 
GCCAGAACCC ACCTCAGAAA ACTGTTCTTC TCCGTTTGA

Protein sequence

MSTPRTIAIY GKGGIGKSFT TTNLSATFAL MGKRVLQLGC DPKHDSTTSL FGGVSLPTVT 
EVFAEKNARN EELQISDIVF RRDIPDFPQP IYGVELGGPQ VGRGCGGRGI ISGFDVLEKL 
GLFSWDLDVI LMDFLGDVVC GGFATPLARS LSEEVILLTN NDRQSIFTAN NICQANNYFK 
TVGGESKLLG LIINRDDGSG IAEKYAAEAG ITILMKLPHN TAARDKDDSF DFAVRLPEIG 
EPFRKLATDI LERKITPCEA AGLDFQTFIR LFGEVNEAHP TPASQDELTG QKQQINGERP 
EAAQNDSVSP ESEKLFACIE KLPDSEKEIY RLIEVEKKSA AEAAGIKGIS EAEAQEIFSS 
ARTHLRKLFF SV