Gene Cpha266_1813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1813
Symbol
ID	4570364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2068032
End bp	2069120
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	48%
IMG OID	639766395
Product	glycosyl transferase family protein
Protein accession	YP_912253
Protein GI	119357609
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATGA TCAGCATCAA TGCTGCAGGC AGACACCATC TTCCCGATAT CGATTGCGTC 
CTCATCGGCG TTAACTGCAG TAAAACGCTG GCAAGATGCC TTGATTCGAT ACGATCGTGC 
GATTACCCAC AGGAAAAATT GCATAGCTGT TATGTTGACG GCGGGTCAAC TGACAAAAGC 
ATTGAGATCG CCGAACGGTA TGAGGATGTT ACGGTTATAG CGCTTGATCC TGCATATCCG 
ACGCCTGGAA TGGGAAGAAA TGCCGGCTGG AAACACAATA AGTCGCCGTT TGTTCAGTTT 
CTTGATTCTG ATACCATTCT TGACGCACGC TGGCTTCGTA AAGCTGTTGA GGCAATGGCG 
GATGAGCGAT TCGGAGCGGT GATTGGCATG CGTCAGGAGA TGTATCCTGA ACGCACGGTC 
TATAACTGGA TTGGCAATAT CGAGTGGAAC GGGCCCGCAG GTCTGTCCGA TTGTTTCGGA 
GGAGATGTTT TTATCCGGCG CACAGCGCTT GAAAAAACAG GAGGATACGA CGAAACGCTT 
GTAGGCGGTG AAGATCCGGA ACTCAGCCGG AGGGTGATCA GGGCAGGCTG GCAGATTGTT 
CGGCTTGATG CGCTGATGAC AAGGCATGAT CTGGCCATGA CCACGATGAG TCAGTATTTT 
CGGCGGGCAT TTCGTTCCGG CTATGGCTTT GCCGCGGTGA GTTTTCGTGA ATCCCTGGTT 
GGGAGTTCTT TCTGGAAGTA CGATGTTTTG AAAATTTTCA TTAAAGCGGG GAGTTTTTTC 
GGTTGCATCG TTCTTGCTTT ACTCTTGTTT TTTGTTACAC AAGCAAACAG TGTAAAAATT 
ATAGCGGCTT TTCTTCCCTT TGTTGGACTT ATGGTGATGC TCTCTCCCCG GCTGTTTAAA 
ACAGGAAAAT TCATGCGTGA AAATAATCTG AACAAGAACG ATGCGAAAAG GTATGCATGG 
CACTGTTCGG TAGTGGTTGT TCCCCAGTTT TTCGGGATCA TCCGGTTTCA CCTTGGCCGT 
ATTTTCAATA AACCCCTGAA AAACAGGCGC CGAAATCTCA AAACAGGAAT TTCAATTTCC 
GGCACATGA

Protein sequence

MNMISINAAG RHHLPDIDCV LIGVNCSKTL ARCLDSIRSC DYPQEKLHSC YVDGGSTDKS 
IEIAERYEDV TVIALDPAYP TPGMGRNAGW KHNKSPFVQF LDSDTILDAR WLRKAVEAMA 
DERFGAVIGM RQEMYPERTV YNWIGNIEWN GPAGLSDCFG GDVFIRRTAL EKTGGYDETL 
VGGEDPELSR RVIRAGWQIV RLDALMTRHD LAMTTMSQYF RRAFRSGYGF AAVSFRESLV 
GSSFWKYDVL KIFIKAGSFF GCIVLALLLF FVTQANSVKI IAAFLPFVGL MVMLSPRLFK 
TGKFMRENNL NKNDAKRYAW HCSVVVVPQF FGIIRFHLGR IFNKPLKNRR RNLKTGISIS 
GT