Gene Avin_30040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_30040
Symbol
ID	7761905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3110818
End bp	3111942
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	72%
IMG OID	643805877
Product	Glycosyl transferase, group 1 family protein
Protein accession	YP_002800145
Protein GI	226945072
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.060295
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCTTCC TGCTCGTCGC CGGCTTCCCC GACTCGCTCC TGTCGTTTCG CGGCCCGCTG 
CTCGAAGCCC TGCTCGCCCG CGGCCTGGAG GTGCACGTGG CGGCGCCGCA CCTGGCGCCC 
GGCTGCCTCC TGCGCCAGCG CCTGGAGGCA CGCGGTCTGC GGGTGCACGA CATTCCCCTG 
CGGCGCACCG GCATGAATCC GCTGCAGGAC TGCGCCACCC TGCTGCACCT GTGGCGGCTG 
AAGCGGCGCA TCCGCCCGAC CCATGTCCTC GGCTACACCG CCAAGCCGGT GATCTACGGT 
TCGCTGGCCG CCGCCTGGGC CGGGGTGCCG CGACGCTTCG CGCTGATCAC CGGGCTGGGC 
TACGCCTTCC TCGGCGAGGC GGGGGACGGC GGCGCCCGCG GCCTGCTGCA CGCCCTGCTG 
CCGCGCCTCT ACGCGCTGGC GCTGCGGCGA ACCCACAAGG TGTTCTTCCA GAACCCGGAC 
GACCAGGCCC TGTTCCGCGG CCAGGGCATC CTCGGCCCGG CGACGCCCTC CTGCGTCATC 
AACGGTTCCG GCGTGGACCT GCTCGAATAC CCCGTCGCGC CCGTACCGGC GCGACCGCAC 
TTCCTGCTGA TCGCCCGGTT GCTGGGCGAC AAGGGCGTGC GCGAATACGC TGCGGCGGCG 
CGCCAGGTGA AGAACCGCTG CCCGGCGGCG CTGTTCAGCC TGGTCGGCTG GATCGACGAC 
AACCCCGACG CCATCGGCCA GGCGGAACTG GACGGCTGGC TGGCCGACGG CACGCTGCAC 
TACCTCGGCC GCCTGGACGA CGTGCGCCCG GCGATCGCCG CCTGCAGCGT GTACGTCCTG 
CCCTCCTACC GCGAAGGCAC GCCGCGCACG GTACTGGAAG CCATGGCCAT GGGCCGCGCG 
GTGATCACCA CCGACGCCCC CGGCTGCCGC GAGACGGTGG TGGACGGCGA CAACGGCTTT 
CGCGTGCCGG TGAAGGCGGT GGACGAGTTG GCCCGGGCCA TGCAGCGCTT CGTCGAGGAA 
CCGGCGCTGG CCGTGCGCAT GGGCGCCCGC TCGCGGCAAC TGGCCGAGGA GAAATATGAT 
GTGCAGCGGA TCAACGCCCG CCTGCTGCAG GAGATGGGTC TCTGA

Protein sequence

MIFLLVAGFP DSLLSFRGPL LEALLARGLE VHVAAPHLAP GCLLRQRLEA RGLRVHDIPL 
RRTGMNPLQD CATLLHLWRL KRRIRPTHVL GYTAKPVIYG SLAAAWAGVP RRFALITGLG 
YAFLGEAGDG GARGLLHALL PRLYALALRR THKVFFQNPD DQALFRGQGI LGPATPSCVI 
NGSGVDLLEY PVAPVPARPH FLLIARLLGD KGVREYAAAA RQVKNRCPAA LFSLVGWIDD 
NPDAIGQAEL DGWLADGTLH YLGRLDDVRP AIAACSVYVL PSYREGTPRT VLEAMAMGRA 
VITTDAPGCR ETVVDGDNGF RVPVKAVDEL ARAMQRFVEE PALAVRMGAR SRQLAEEKYD 
VQRINARLLQ EMGL