Gene Cpha266_0358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0358
Symbol
ID	4569336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	400322
End bp	401470
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	44%
IMG OID	639764956
Product	glycosyl transferase, group 1
Protein accession	YP_910841
Protein GI	119356197
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.348726
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTG GTATCGACTT TACGCACGAT CTGGGGTATA GCGGCATAGG GACATACTGT 
CGTTCTCTTA CAGAAGCGAT GGCACAACGC GAACCGGAAA ACATATACAA TATCCTCACC 
CTTCACCATA AAATTCCAGA GGTTCAGCAA CACTTTTCAA ATCTGCGCGC TATTGTCTAT 
TCGGCACCGT TTCCAAATCC AATGCTATTA GGAGGGAAAT GCAATAAAAT GATTAGAAAA 
TATCATCAGA CAATCTGGAA AAAAAAGGCT GCCAACTATG ACCTTGTTCA TTTTACGCAC 
CAGGGATATT TTGTTCCCGG TATTGAGAAT GCCGCAGTAA CGATACACGA CCTGATTAAG 
CTGTATAACA AGAGTTATAC GGCCATTGAA ACAACTCACC CCCTTTTTCT GACAACAAAA 
AAGATGATCA ATGATGCCGC GACCATTTTC GTGCCGTCAG AATTTGTGCG CAATGAGCTC 
AGAAACTACT TTGCCGGCTG CGAAAAGAAG GTAAAGGTCA CCTATGAAGG CATTAAACCT 
GTCTATCGAC AAACCCCTCC TGATCCCGCT GTTCTAAAGA AATACGACCT GCTGGATAAC 
GGCAGGTTTT TTCTCTATGT TGGCCGATAT GAGTCAAGAA AAAACCTCGA CAGACTGATT 
CTTGCCTATG CACAGCTCCC CGATACATTA AAAAAAGATA CCCTGCTGGT GCTGATCTGT 
CCAACCGAAA AAAAATCGAC AAAAGAGCTG CAAAAAAAAA TCGCTGGCGC CGGTCTCGAA 
AAAAATGTTC TGCATCTGGT ACACGTACCT GATAACGACC TCGTACACCT TTATAATGCT 
GCCCTTGCGC TTCTTTTTGT ATCCTTCTCT GAAGGATTCG GTCTGCCGCT CGTTGAAGCC 
ATGAATTGTG GATGTCCGGC TATAATTGCC AACAGCTCCT CGCTTCCTGA AATATCGGGG 
AGCTCGTCCC TTCTGGTTGA CCCCTATGAC ACAGAATCAA TTCGTCAAGC AATGCTTGCA 
ATCAGTGAAG ACTCCCTGCT ACGAAACGAT CTTTCAAAAA AATGTATCGT GCGAGCACAA 
CGTTTTTCCT GGCAAACAAC CGCTCAGGAA ACACTGAAAG GATACCATGC AATGCTGAAT 
AAACCGTAA

Protein sequence

MNIGIDFTHD LGYSGIGTYC RSLTEAMAQR EPENIYNILT LHHKIPEVQQ HFSNLRAIVY 
SAPFPNPMLL GGKCNKMIRK YHQTIWKKKA ANYDLVHFTH QGYFVPGIEN AAVTIHDLIK 
LYNKSYTAIE TTHPLFLTTK KMINDAATIF VPSEFVRNEL RNYFAGCEKK VKVTYEGIKP 
VYRQTPPDPA VLKKYDLLDN GRFFLYVGRY ESRKNLDRLI LAYAQLPDTL KKDTLLVLIC 
PTEKKSTKEL QKKIAGAGLE KNVLHLVHVP DNDLVHLYNA ALALLFVSFS EGFGLPLVEA 
MNCGCPAIIA NSSSLPEISG SSSLLVDPYD TESIRQAMLA ISEDSLLRND LSKKCIVRAQ 
RFSWQTTAQE TLKGYHAMLN KP