Gene Avin_44850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_44850
Symbol
ID	7763356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4541185
End bp	4542249
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	73%
IMG OID	643807336
Product	lipopolysaccharide heptosyltransferase I, waaC
Protein accession	YP_002801577
Protein GI	226946504
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID	[TIGR02193] lipopolysaccharide heptosyltransferase I

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.721697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCGTAC TGCTGATCAA GACCTCCTCG CTGGGCGATG TCATCCATAC CCTGCCGGCC 
CTGACCGACG CGGCGCGGGC GCTGCCCGGC ATCCGTTTCG ACTGGGTGGT GGAGGAGGGC 
TTCGCCGAGA TTCCCGCCTG GCATCCGGCC GTGGAGCGGG TGATTCCCGT GGCCATCCGC 
CGCTGGCGCC GGAGTCCCTG GCAGGCGACC ACCCGTGACG AATGGCGGCG CTTTCGCCAG 
ACCCTGGGAG AGGGCCGCTA CGACCTGGTG ATCGATGCCC AGGGGCTGTT GAAAAGCGCC 
TGGCTGACCC GCTTCGGCGG CGCGCCGGTG GCCGGGCTGG ATCGCCGTTC GGCGCGCGAG 
CCGCTGGCCA GTCTCCTCTA TGGGCGGCGC TATCCCGTGC CTTGGGGACA GCACGCGGTG 
GAGCGGGTGC GCCAGTTGTT CGCCCAGGCG CTGGGCTATC CGCCGCCGAC GGCGGTCGGC 
GACTACGGAC TGGACCGCCA CCGCTTGGCC GTGCCGGACG GCGCGCCCTA CCTGCTGTTC 
CTGCACGGCA CCACCTGGGA CAGCAAGCAC TGGCCGGAAA GCTACTGGCG CGAGCTGGCC 
GAACGCATGG GCAGTGCGGG CTGGGCGGTG CGCCTGCCCT GGGGCAATGC GGTGGAGCGG 
GACCGCGCCG GGCGCATCGC CGAGGGGCTG GCGTCGGTCG AGGTGCTGCC CCGGATCAAC 
CTCGCCGGCA TCGCCGGGAT TCTCGCCGGG GCCAGCGCCT GCGTGGCGGT GGACACCGGC 
CTCGGCCACC TGGCGGCGGC GCTGGATGTG CCGACTGTCT CCCTCTACGG CCCGACCGAT 
CCGCGCCTGA CCGGCGCCTA CGGTCGTCAC CAGCGCCGCC TGACCAGCGA CTACCCGGCC 
TGCGTGCCCT GCCTGCGCAA GACCTGCGGC TACCGGCCGA CCGAGGAGGA CCGCCGCCGG 
CTGGATTTGA GCCGCGAGCA GCCGGTGTGC TTCAGTCGCA TCGATCCGCG GCGGGTGGCC 
GGCGCCTTGC AGGCGCTGCT GGACGAGGCG GCCTGCCGAT GCTGA

Protein sequence

MRVLLIKTSS LGDVIHTLPA LTDAARALPG IRFDWVVEEG FAEIPAWHPA VERVIPVAIR 
RWRRSPWQAT TRDEWRRFRQ TLGEGRYDLV IDAQGLLKSA WLTRFGGAPV AGLDRRSARE 
PLASLLYGRR YPVPWGQHAV ERVRQLFAQA LGYPPPTAVG DYGLDRHRLA VPDGAPYLLF 
LHGTTWDSKH WPESYWRELA ERMGSAGWAV RLPWGNAVER DRAGRIAEGL ASVEVLPRIN 
LAGIAGILAG ASACVAVDTG LGHLAAALDV PTVSLYGPTD PRLTGAYGRH QRRLTSDYPA 
CVPCLRKTCG YRPTEEDRRR LDLSREQPVC FSRIDPRRVA GALQALLDEA ACRC