Gene Cpha266_0306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0306
Symbol
ID	4570599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	340193
End bp	341449
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	53%
IMG OID	639764906
Product	hypothetical protein
Protein accession	YP_910792
Protein GI	119356148
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0825598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCC TTGAAAAATT ACAGATTCTG TCCGGAGCAG CGCGTTACGA CGCCTCGTGT 
TCATCCAGCG GTAGCAAACG AGAAGGATCT TCGAGCGGCC TTGGCAACAC TTCGTCGAGC 
GGTATATGCC ACTCCTGGTC GGATGACGGG CGGTGTATTT CGCTGTTGAA AATTCTCCTC 
TCCAATGACT GTCGTTACGA TTGCGCCTAC TGTGTCAACA GGATATCCAA TCCGGTTCAG 
AGAGCCTCTT TCACTGCACG GGAAGTGGTC GATCTCACTA TGGAGTTTTA TCGGCGTAAC 
TATATCGAGG GTCTCTTTTT AAGCTCGGCA GTCATGCAGA GCCCCGATCA CACCATGGAG 
CGGATGGTCA GCGTTGCCGA AACGCTTCGT ATCGATGAAA AATTCGGCGG CTACATACAT 
CTGAAAATCA TTCCGGGCAG CAGCAGCGAA CTGGTGCGGA AGGCGGGACT CTATGCCGAT 
CGCATCAGCG TCAATATCGA GCTCCCCTCC GAGACGGCTT TACAGCGTCT TGCGCCACAG 
AAACAGAAAG CCGGCATTCT TGAGCCAATG GCCTTTATCG GACGGGAGAT AAAAGGATCT 
CTTCTTGAGC GGCAGAGAGG TCGCAACGCG ACGCCACGGT TTGCTCCTGC CGGACAGAGC 
ACTCAGATGA TTATCGGAGC AAGCCCCGAA AGCGATTTTC AGATACTCAA GCTTTCACAG 
GGGCTCTACA AAAAAATGAA TCTTAAACGG GTCTATTATT CGGCTTTTAT TCCGGTCAAT 
GAGGACAGTC GTCTTCCCGT GCTCGCCTCG CCGCCGCTCC TTCGCGAACA CAGGCTCTAT 
CAGGCCGACT GGCTGCTGCG CTTTTACGGT TTTACCGCAG AAGAGATTCT TTCAGACGAA 
GCGCCCAACC TTGACGAAAC ATTTGATCCC AAAACAGCCT GGGCTCTTCG CAATCCCGGG 
TTTTTTCCTG TAGAGATCAA TCGCGCAGAC TATAGCGTTC TCCTTCGTGT TCCAGGTATA 
GGGGTCACTT CGGCCAGGCG TATTGTTGCC GCTCGTCGGT TTGCCTCCAT TACCCCTGAA 
GGAATGAAAA AGATCGGAGT GGTCATGAAA CGGGCGAAAT ATTTTATCAC CTGCTCCGGC 
AGGCCTTTTG AAAATACAGA CCGGCAACCG GCCCTTCTGA AGAGCCGGCT CCTGCTTGCC 
GGGGGCGTCG CTCCGGAACC TCCGAAGCAG CTTGTGCTGC CCGGCCTTTT TGCCTGA

Protein sequence

MNTLEKLQIL SGAARYDASC SSSGSKREGS SSGLGNTSSS GICHSWSDDG RCISLLKILL 
SNDCRYDCAY CVNRISNPVQ RASFTAREVV DLTMEFYRRN YIEGLFLSSA VMQSPDHTME 
RMVSVAETLR IDEKFGGYIH LKIIPGSSSE LVRKAGLYAD RISVNIELPS ETALQRLAPQ 
KQKAGILEPM AFIGREIKGS LLERQRGRNA TPRFAPAGQS TQMIIGASPE SDFQILKLSQ 
GLYKKMNLKR VYYSAFIPVN EDSRLPVLAS PPLLREHRLY QADWLLRFYG FTAEEILSDE 
APNLDETFDP KTAWALRNPG FFPVEINRAD YSVLLRVPGI GVTSARRIVA ARRFASITPE 
GMKKIGVVMK RAKYFITCSG RPFENTDRQP ALLKSRLLLA GGVAPEPPKQ LVLPGLFA