Gene Caul_0889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0889
Symbol
ID	5898344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	942611
End bp	943645
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	71%
IMG OID	641561372
Product	glycosyl transferase family protein
Protein accession	YP_001682518
Protein GI	167644855
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0302002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.175514
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCCG CCCCCAAGCC GCCCGGCCCC GTCCTCGTCT ACGCCCCCGA TCGCGGGATC 
GGCGACCTGA TGTGGCATCT GCCGACCTTT CGGGCCATCG CCGCGACCAC GCCGGAGAAG 
CAAGTGGTGC TGGCCGCGCG GCCGTCGAGC CATGCGCGGC AAGTGCTGGC GGTCGAGCCG 
TCGATCAGCA AAGTCGTCTA TGCCCGACAT TTCACCGGTA CGCTGAGGGG CGTGCACGAA 
GTGCTCGACT TCTGGCGGAT CTGCCGCGAG GTGAAGCCGC GCGCTGTGTG GATCCTGGAG 
AAGATCGGTC GTCCCGCCCA AGCCGCCTGG TTGGCCGGCG TGCCCGAGCG GCGCGGCTTT 
GGCCTGGGTC ACAGGAGCCA GGAGCAATGG CTGCAGGGAC CGTTCCTGCC CAAGTCCATG 
CGCCCCGCCC ACCGGCTGGA CAAACTGGCG GCCTTCGAGG CCCTGCACGG GTTGAGCGTC 
GACAGCCGCG AGCCGACCCT GCTGCTCGAC CCCAAGGCCG TGGCGGCCGT CAAGGCCCGG 
TTCGGGGATC GGCCCGGTCC CTGGCTGGTG CTGGGCGTCG GGGCCAGCGA GCCGGCCCGC 
ACCTGGCCCG CCGAGCGTTT CGCCGCCGTG TCGCAAGCCC TGGCAGACCT GTTTCCGACG 
GTGTTCTGGC TGGGCGGACC CAACGACGCC CCGCGTCTGA AGGCCACGGT CGAGGCTCAG 
CCGCCCCTCT CCCAGGACTT GGGCCGCGAC ATCCTGGCCT GCGACCTGCC GCTCGACCAG 
GCCGCCGCCC TGATCGCCCT GTCGGCCGGG TTCCTGGGCA ATGATTCGGG GCCGCTGAAC 
GTCGCCGCCT CGGTGGGCCG GCCGGCCATC GGCCTGATGG GCACAAGCCC CGTTCCGGTC 
TATTCGCGCT GGCTTTCCCG GCTCGACGGC GGGGAAGGGC GGATCGCCGA TATTTCGGTC 
GATCAGGCGC TCGAAGCCGT TCGAACCCGG TTCACCGACG AGGCCTGGGC CAACCGCGAC 
ATCCCGGCGA CTTGA

Protein sequence

MSPAPKPPGP VLVYAPDRGI GDLMWHLPTF RAIAATTPEK QVVLAARPSS HARQVLAVEP 
SISKVVYARH FTGTLRGVHE VLDFWRICRE VKPRAVWILE KIGRPAQAAW LAGVPERRGF 
GLGHRSQEQW LQGPFLPKSM RPAHRLDKLA AFEALHGLSV DSREPTLLLD PKAVAAVKAR 
FGDRPGPWLV LGVGASEPAR TWPAERFAAV SQALADLFPT VFWLGGPNDA PRLKATVEAQ 
PPLSQDLGRD ILACDLPLDQ AAALIALSAG FLGNDSGPLN VAASVGRPAI GLMGTSPVPV 
YSRWLSRLDG GEGRIADISV DQALEAVRTR FTDEAWANRD IPAT