Gene Cphamn1_1272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1272
Symbol
ID	6374949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	1380444
End bp	1382036
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	57%
IMG OID	642683770
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001959685
Protein GI	189500215
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0216258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCGA TACTGACAGC CGGGGAAATG TCGAGAGCCG ACCGTGCAGC GATTGAACTG 
CTGCACACCG ATGAGCCGAG ACTTATGGAA CTCGCTGGCC GTGAAGCCTC TCGAATCATT 
GCGCAAACAT TTGAAACAAC CGGCAGAGAG GGCCTTCATG AACTCGACTT TCTGCTTGTC 
TGCGGAAAAG GCAACAACGG AGGTGACGGG TTTGTACTTG CCCGGCATCT GCTCAATCTC 
GGAGCATCGG TTGACCTGAT CCTGTTGTAT CCATCGGAAA ACCTTGCAGA AATCAATCGA 
AACGGACTGA CCATTGTCCA GGCCTACAGA AATCACACAG AAAAGCTGCG GATCTTCAAC 
GGTCTTGACG AAGCTATGCC GTTAATCTCC GAACGGGAGT ACGACGGGAT CGTCGATGCG 
CTTCTCGGAA CAGGACTGCG GCTGAAGCGC GACGGAGAGC CGCTGAAGTC CCCGCTTAAA 
CAGGCGGTCG AACTCATAAA CACTCTCCGT GAACAAAGCC CTGCCGTAAC CATCGCCCTT 
GACCTGCCAA GCGGCCTTGA CGCCACGAGC GGCTTTGCTT CGCAGCCGGC CGTCATGGCG 
GATCTGACCG TCTGCATGGC CTATATGAAA ACCGGTTTTT TCCTGAATTC CGGCCCGGCG 
CTTGCTGGAG AGATCCACGT GGCGGAAATT TCCATTCCAC CGTTCCTTGT CGAGAACTGC 
ACCTGTCATC TTACCGACGA GGATTTTGCC GCGGAACAGT TCACGCTTCG CGATACCGAC 
GGGGCGAAAC ACCGCAACGG AAAACTGCTC GTGATCGCAG GCTCCTCAGA CAGCAGGAGC 
TCTATGCTCG GCGCTTCCCT GCTCACCGCA AAAGCCGCGA TCAACACCGG AGCAGGATAT 
GTCTGCGTTT CCCTCCCCCC GGAACTTTCC GGTCCGCTGC ACACCTATGT TCCTTCAGCG 
ACGGTGACCG GAAGAGAGTA CGAATCACTC CTCGAAAAAG CCGCCTGGGC AGACGCAATC 
GTCATAGGAT GCGGCCTGGG AAGGGAAAAA GATACGATTG ACCTTCTGCA CAGGCTTCTT 
GCAGATCCGG TCATCGCCTC AAAAAAACTG GTTCTCGACG CAGACGCACT CTACGCGCTC 
TCCCAAAACG GTTTTTCTCT TGCTGAACAC GAGTACGCCG ACACGCTGCT CACCCCGCAC 
ACAGGAGAGT TCAGCAGACT CACCGGCCTT TCCCTTGATG CGATACACGC TGACCCTCTT 
GACGCCGTTC GCAGTTTTTC GTCCGCGAAC AAGGTAAACC TGCTCTTGAA AGGCAACCCG 
ACCTTCATCA CCTCTCCGTC GGGCGATCTG CTTGTCAACA ACAGCGGAAC CGAGGCGCTC 
TCCACAGCAG GCACGGGCGA TGTTCTTGCA GGAATGATCG GCGCGCTTGC CGCCAAAGGA 
ACAGACACCT TCCACGCCGG AGCCGCCGCC GCATGGTTCC ACGGCCGCGC CGGAGACCTC 
GCCAGAGATA TATCAAGCCT GGTGTCGTCG GAAGATGTGC TTGGGGCTAT CCCCAAAGCC 
ATTGCAGAAA TTTTCTTCGC CGAGGAGGAG TAA

Protein sequence

MLPILTAGEM SRADRAAIEL LHTDEPRLME LAGREASRII AQTFETTGRE GLHELDFLLV 
CGKGNNGGDG FVLARHLLNL GASVDLILLY PSENLAEINR NGLTIVQAYR NHTEKLRIFN 
GLDEAMPLIS EREYDGIVDA LLGTGLRLKR DGEPLKSPLK QAVELINTLR EQSPAVTIAL 
DLPSGLDATS GFASQPAVMA DLTVCMAYMK TGFFLNSGPA LAGEIHVAEI SIPPFLVENC 
TCHLTDEDFA AEQFTLRDTD GAKHRNGKLL VIAGSSDSRS SMLGASLLTA KAAINTGAGY 
VCVSLPPELS GPLHTYVPSA TVTGREYESL LEKAAWADAI VIGCGLGREK DTIDLLHRLL 
ADPVIASKKL VLDADALYAL SQNGFSLAEH EYADTLLTPH TGEFSRLTGL SLDAIHADPL 
DAVRSFSSAN KVNLLLKGNP TFITSPSGDL LVNNSGTEAL STAGTGDVLA GMIGALAAKG 
TDTFHAGAAA AWFHGRAGDL ARDISSLVSS EDVLGAIPKA IAEIFFAEEE