Gene Cpha266_2514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2514
Symbol
ID	4569601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2878427
End bp	2879428
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	52%
IMG OID	639767074
Product	glycosyl transferase family protein
Protein accession	YP_912926
Protein GI	119358282
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02195] lipopolysaccharide heptosyltransferase II

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.566705
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGCAC TCAAAAGGGT TCTGGTGGTT CGCTTAAGCT CCATCGGCGA CATTATTCTC 
ACTACACCGT TGCTCAGAAG GTTGAAGGCC CTCTGGCCGG ATGTCGAGAT AGATTATTAT 
ACCAGGCGGT CGTTTGTCGG GCTTCTTGCC TCAAATCCGA GGGTATCGAA GGTTTTTACC 
GGGGAAGACC CTCCTTCGGG TCCCTATGAT CTTGTGATCG ATCTCCAGAA TAATTTTCGC 
TCGCATGCGA TGATCAGGTC GCTTGAGGCT GGTCGCACTG CGCGATACCG TAAACATAAC 
TGGAAAAAAT GGCTTCTGAT CCATTTCGGG ATTGATCTGT ACGGTTCCGG TCAAAGCGTT 
GTAGATCGTT ATCAGAGTGC TGTGAAGGAG TTTGGCGTTC AGAGCGATGT TCAGGGGTGC 
GAGCTCTATC CTGCTGCCGG GGAGCGGGCG TTTGCCGTTC CATTTTTTTC TGACGGTCAA 
CCGACGCTCG CGCTCTGTTT TGGCGCGAAG CATTTTACCA AACGATATCC ATCTCGTCGC 
TTTGCGACGG TGCTCTCCCT GCTGTTTGCA ACGTTGCCTT TGCGGGTGCT GCTTCTTGGC 
GGGCAAGAGG ATGCTCCGTA TGCCATTGAA ATAATGCAGG CCTTGCCGGA GCACTTCCGG 
CATGCTGTCG TAAACCTTGC GGGGAGCTGT TCGCTTATGC AGACGGCGGC GTTGCTCGAA 
CGGTGCGATG CCGTGCTTTC TAATGATACG GGTCTGATGC ATATGGCCTC AGCGTTCGGT 
AAAAAGCTTT TTGTCCTGTT CGGTTCTTCA AGTGCATTCT TCGGCTTTCT TCCCTACCAT 
ACGCCGTTTG AGCTGTTTGA AGTGGCGGGT CTCCGCTGTC GTCCCTGCTC TCATATCGGT 
CGCGATCGAT GCCCGAAAGG CCATTTTCGT TGTATGAATG AGTTGTCTGA ATCGCTGATT 
GCCAAAAAGA TTGTCGACTA TTTTAACACT GAACGGTCAT GA

Protein sequence

MQALKRVLVV RLSSIGDIIL TTPLLRRLKA LWPDVEIDYY TRRSFVGLLA SNPRVSKVFT 
GEDPPSGPYD LVIDLQNNFR SHAMIRSLEA GRTARYRKHN WKKWLLIHFG IDLYGSGQSV 
VDRYQSAVKE FGVQSDVQGC ELYPAAGERA FAVPFFSDGQ PTLALCFGAK HFTKRYPSRR 
FATVLSLLFA TLPLRVLLLG GQEDAPYAIE IMQALPEHFR HAVVNLAGSC SLMQTAALLE 
RCDAVLSNDT GLMHMASAFG KKLFVLFGSS SAFFGFLPYH TPFELFEVAG LRCRPCSHIG 
RDRCPKGHFR CMNELSESLI AKKIVDYFNT ERS