Gene Cpha266_1053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1053
Symbol
ID	4571015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1195433
End bp	1196746
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	53%
IMG OID	639765656
Product	hypothetical protein
Protein accession	YP_911524
Protein GI	119356880
COG category	[S] Function unknown
COG ID	[COG1322] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGACG GGATGATGGT TTTGCTTCTT GTTCTGGTGT TCGGGCTTCT TTTTTTTATC 
GTTTTTCGCA TTCTGCGCGA TGCTCCCCTC AAAGAAGAAC TGCACCAGCT CAGGGTTGTC 
GAGCGGGAGC TTCGCTCTCA GGTGGATGAG CTAAAGGCAA AAACCGGGGA GCTTGATATA 
TTGAAAGTTA TCCGTGCCCG TCTCGAATCA GATCTTGACC ATGAGCGCAG CAATGCATTG 
GAGAAAATTG CGCTTCTGCA GCAATCGGAA TTACGACTGA AAACAGAGTT CGAGCATCTT 
GCCGGGCGTA TTCTTGAAGA GCGTGGAAGC TCGCTTGGAG AGGAGAACCG GGTTAGAATG 
GCTTCACTTC TGCAGCCGCT TAAAGAGCAG CTCGATGCAT TCCGCACGCG AGTCGATGAG 
GTACATCGAA ACGATACCGA GATTTCCGCC CGACTTATCG AGCAGGTACG ACAGCTCCAG 
GAGCTCAGCG GGCAGGTGAG CAGAGAGGCT AATTTACTTG CCCGGGCTAT CAAGGGCGAG 
AGTAAAGCAC AGGGCGACTG GGGAGAACTG ATCATTGAAA GGATCTTTGA GGCTTCGGGG 
CTTGAAAAAG GGCGGGAGTA CACCGTACAG GAGAGTTTCA GGATGGAGGA TGGTACTCTG 
AAACGGCCTG ATTTTATGGT TCTCCTTCCG GGTGAAAAGG CCGTTATAGT CGATTCAAAA 
GTCTCTCTGA CGGCCTATGA ACGCTATTGC AGCCTTGATG ATGTTGCCAG GCGGGAGCAG 
GCTCTTCGGG AGCATGTTCA ATCGGTGCGC CGTCACATAG CCGGGTTGCA GGAAAAGGAG 
TACAGCTTTA TCAAGGGGAA TCGTACGCTT GATTTCGTCA TCATGTGCAT TCCCGTGGAA 
CCGGCATGGC AGGCTCTCAT GCAGGCAGAC CCGGAGATCG TATACGAACT TGGCAGAAAA 
AACGTGGTGC TGACCGGCCC GACCACGCTG ATGATCACCC TGAAGCTTAT TGCGCAGCTC 
TGGCGGCGCG AGAAAGAGAA TCGTAATGCC GAGGTTATTG CCGAAAAGGC CGGTCGGATC 
TACGATCAGG TTGTTCTGAT AGTCGAAGCC ATGGAGGATG CACGAAAAAA ACTTTCGGGC 
GTCTCCCAGT CATTTGATCT TGCCATGAAA CGACTCACGG AAGGACGGGG GAGTCTGGCG 
TCGAAGGTTG AGGAAATCCG TCGGCTTGGG GCAAAGGTCA GCAAACAGCT TCCCGGGGGT 
TTTGACGATA ACGAAGAGAG CGAGAGCGTC AACGGGAATA GCTCGGCCTT CTGA

Protein sequence

MSDGMMVLLL VLVFGLLFFI VFRILRDAPL KEELHQLRVV ERELRSQVDE LKAKTGELDI 
LKVIRARLES DLDHERSNAL EKIALLQQSE LRLKTEFEHL AGRILEERGS SLGEENRVRM 
ASLLQPLKEQ LDAFRTRVDE VHRNDTEISA RLIEQVRQLQ ELSGQVSREA NLLARAIKGE 
SKAQGDWGEL IIERIFEASG LEKGREYTVQ ESFRMEDGTL KRPDFMVLLP GEKAVIVDSK 
VSLTAYERYC SLDDVARREQ ALREHVQSVR RHIAGLQEKE YSFIKGNRTL DFVIMCIPVE 
PAWQALMQAD PEIVYELGRK NVVLTGPTTL MITLKLIAQL WRREKENRNA EVIAEKAGRI 
YDQVVLIVEA MEDARKKLSG VSQSFDLAMK RLTEGRGSLA SKVEEIRRLG AKVSKQLPGG 
FDDNEESESV NGNSSAF