Gene Cpha266_1604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1604
Symbol
ID	4571127
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1825412
End bp	1826536
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	32%
IMG OID	639766185
Product	hypothetical protein
Protein accession	YP_912049
Protein GI	119357405
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATATAG ATGTTAATAA ATATCGTGAG GCACATATTT TATCAAATCC TGACATTGAT 
TTTGAGGTCT CATATAATTT TTTCTATGAC GAAACCGGCA ACATCAGAAA GTATCATGTG 
AGAGAGGATG GCTTTAATGT ATCTTCAAAT TTAAGTTTTG TGCTTGGCGG TATTGTATTT 
GACGGTCCGC CACAGGATCT GACTGTTCTT TTTAATGAGC TGCGTCTTGA TCCTTCAATG 
AAAGAACTGA AATTTGGGTA TGTGGCTAAA GGGGATTTCT TGTCTTGCTT GAAGTCGGAA 
AGATTACTTG TTTTTTTTCG CTATTTATTG GACAACAATA TCTATATACA CTATTCCGTG 
GTCAATGTAC TGTATTACTC CTTGGTTGAT ATTGTTGATT CTGCAATAAG CATCTTTCCT 
GAAGGATCAA AGCTGGGTCC GCAAATTATC AATAATTTGA AAAATGTATT GTATGTTCTG 
GCTAAGAGAG AGATTGATGC TATTGCAAGC CTTTTTTACC GCCACAAATA CCCAAACATA 
TCAAGTAATT CAGTCATCTC ATTTATTGAT GATCTTTATT TTCTATTTGA TAAATATGCC 
GAGGATGAAG ATTACAGTTT TTGGATAAAA TTTCTCAAAG ATTTACTTGA TAACTGCAAA 
AAGAAACAAG TTTTAACTTT ATTAGAAGAC GAAGTTGATC ATGTTATGGT TGGTGATTTT 
TTACAATTCT ATATCAAGCC AATTTATTTA TTTAAAAACT CAACACATGT ATTTGATGAA 
GAGAGCGAGA TCATGTCAAA AGTGTCTGAT CATATATTTA TGGACAATAA TAATCAACTT 
GACATACTCT CATTCCAGAA TTCTTCTTCT AACCCCTACA TCCAGATGTC TGATATTCTT 
GTCGGTTTTA TTGGTAGATT TTCTGACTAT ATCATCAATA GTTCTTTAAC TGATATTTCT 
CGTGATCTTT CAAAAATGAC GACAAGGCAG CATGAGTGTC TTGATTGCTA TCTTGCATTG 
ATAAATAAAA GTCATGATAA AAACAAGGCA TTTCTTCATG AAGTAAATGC GATAACAGAA 
CACGATAAGA GAGTATTTAT ATTAAATACA AAAGGGTATT TATAA

Protein sequence

MDIDVNKYRE AHILSNPDID FEVSYNFFYD ETGNIRKYHV REDGFNVSSN LSFVLGGIVF 
DGPPQDLTVL FNELRLDPSM KELKFGYVAK GDFLSCLKSE RLLVFFRYLL DNNIYIHYSV 
VNVLYYSLVD IVDSAISIFP EGSKLGPQII NNLKNVLYVL AKREIDAIAS LFYRHKYPNI 
SSNSVISFID DLYFLFDKYA EDEDYSFWIK FLKDLLDNCK KKQVLTLLED EVDHVMVGDF 
LQFYIKPIYL FKNSTHVFDE ESEIMSKVSD HIFMDNNNQL DILSFQNSSS NPYIQMSDIL 
VGFIGRFSDY IINSSLTDIS RDLSKMTTRQ HECLDCYLAL INKSHDKNKA FLHEVNAITE 
HDKRVFILNT KGYL