Gene Cpha266_2628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2628
Symbol
ID	4568744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	3014774
End bp	3016171
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	49%
IMG OID	639767192
Product	hypothetical protein
Protein accession	YP_913039
Protein GI	119358395
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.945312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAA ATAAAAGGAT TCGGCAGAAT AAGAAACAGC ATATTCAGGA AATTCTTCCA 
ACAAATGACA AGTTGACCGG CAGGGCTGGC TTGAGCCTGT TTGCCCTGTA TCTGCGCAAT 
ATCCAATTTT TTCCGATCGT TGATCGCATG TTTGGCAGCA TGCGCAAGAA CAGCAAGGGA 
TTGCCGATCA CCGAACTGTT CGTTCAAATG CTGAGCTTTT TCATGGATGG AACGAGTCGT 
CATCTGGTCT GGTTCGACCA GCTTAAGGCT GATGAGAGTT ATTCGGCTGT CCTTGGTTCC 
GAACGATTGG CTTCATCGCA TACCATGAAA CGGTTCTTTG GTGCATTTTC CTTTCGGCGA 
GTCTACCTGT TCAGGAAGTT GTTGCAGGAT CTGTTCATCT GGCGGCTGAA CCAAACAAAA 
CCCAAGGTTA TTGTGCTTGG CCTCGATACG ACGGTCTTCG ACAACAATGA TGCCGAAAAA 
CGTCACGGCG TTGAACCCAC GTATAAAAAG GTCAAAGGGT TCCAGCCCCT GCAACTGAAT 
TGGGGCCGTT ATGTGGTAGA CGCGGTGTTC CGTGGCGGCA AGAAGCACTC CAATCATGGC 
GATACGGCCG AAAAGATGCT GCGGCATATG GTAGGGAAAA TCCGGACAGC ATACCGGGAA 
GATGTTCTCA TCATTGTGCG TATGGACGCA GGGTTTTACG ACGACCAGAT CTTCAACGTC 
TGTGAAGAAC TGGAGATCGG GTATCTGTGT GGCGGTAAAC AATATGCCAA CGTAATCGAT 
GAAGCATCAG AGAGCATTGA TTGGCAAGCC TACAAGAAAG TAACTGATGA ACGGACAAGC 
TGGATGTATA CGGATTTCAT GTGCAAACAG AAGACGTGGA AGAAAGAACG GCGGACAATC 
TTCAGCACAC TTTGGGAAGA CAACGGGCAG TACTTACTCG ACGGGTTATG TCGGGATACG 
GTGATCATTA CCAACATTGG CAAGGGAGAA CCAATCGACA AGCAGCTCAG CGCCATCGAA 
GAAGAGCAGT GGTTCAAAGC CGAAACGATT CTGGCCCGTT ATCACGATCG GGGAACGGAT 
GAACTCACTA ACCGGGCACT GAAAACCTTT GGTCATGAAC AATTGCCCTT CAAACGATTT 
CCGGCAAACG CAGCATGGTA CTATCTGATG CTGCTGGGCA ACAACCTCTT TGAATCCTTC 
AAGGAAGACG TGACAGCATC CGTTATATCG GTGTCGGTCT ATGCTCATAC CTTTCGTCGA 
CAGTTCATCG ATACCGCCGC TCAGATCGTT TGTCATTCAG AAAAGGTGCA GATAAAAGTC 
CCGAGAGCAG CTTATGAGCG GCTCCAATTC GGTAAGCTCT TTGAGATATG CCGGAATCGC 
TTGCCACAAC TCTGTTAG

Protein sequence

MSKNKRIRQN KKQHIQEILP TNDKLTGRAG LSLFALYLRN IQFFPIVDRM FGSMRKNSKG 
LPITELFVQM LSFFMDGTSR HLVWFDQLKA DESYSAVLGS ERLASSHTMK RFFGAFSFRR 
VYLFRKLLQD LFIWRLNQTK PKVIVLGLDT TVFDNNDAEK RHGVEPTYKK VKGFQPLQLN 
WGRYVVDAVF RGGKKHSNHG DTAEKMLRHM VGKIRTAYRE DVLIIVRMDA GFYDDQIFNV 
CEELEIGYLC GGKQYANVID EASESIDWQA YKKVTDERTS WMYTDFMCKQ KTWKKERRTI 
FSTLWEDNGQ YLLDGLCRDT VIITNIGKGE PIDKQLSAIE EEQWFKAETI LARYHDRGTD 
ELTNRALKTF GHEQLPFKRF PANAAWYYLM LLGNNLFESF KEDVTASVIS VSVYAHTFRR 
QFIDTAAQIV CHSEKVQIKV PRAAYERLQF GKLFEICRNR LPQLC