Gene Avin_20620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_20620
Symbol
ID	7760988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	2052086
End bp	2053192
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	63%
IMG OID	643804959
Product	Glycosyl transferase, family 2
Protein accession	YP_002799240
Protein GI	226944167
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID	[TIGR03469] hopene-associated glycosyltransferase HpnB

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.268109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCACCG TATTGTTCGC CGCCCTCCCC TTCATGATCT GGATGGGATT GTTGCTGGCC 
CCTTGGCGGC CATGGAGCAC CCGCGAACGG CTCGAGGTCG ACTCGTCGCC CATGCCGGCA 
GCCGATCTCA GCGGGATTAC CGTACTGATT CCGGCACGCA ACGAAGCCGA AACGATCGGC 
ACCATCCTGG CCACCCTGCA GAAGCAGGGA AACGGCTTGC AGGTGGTGGT CGTGGACGAT 
CAATCCAGTG ACGCCACGGC GAGTATCGCC GCCGCCTACC CCCATACCCG CGTCGTAAGC 
GGCCGCCCCT TGCCTGAGGG CTGGGCTGGC AAGCTGTGGG CGCTGGAACA GGGAAAGTCG 
CAGGTGCACA CGGCAATGAC GCTTTTGCTC GATGCCGACA TCCAGCTTCG CCCCGGCCTG 
CTGCCGGCAT TGCTGGAGCT CAAGCGGCGC GAAGGCCTAC ACTTCGTCTC GTTGATGGCG 
GACTTGCGCC GTACCAGCTT TTGGGATCGC CTGCTGCTGC CAACGTTCGT CTATTACTTC 
AAGCTGCTGT ATCCGTTTGC CCTGTCCAAT TCGCGTAGCA GACATGTCGC CGCGGCAGCG 
GGCGGTTGTG TGCTGGTGGA TACTGAAGTC CTGCGGCATA TAGGTGCCTT CGCCAGCCTG 
CGCAACGCCC TGATCGATGA CTGTACCTTG GCGAGGCAGG TCAAGCAGGC CGGTTACCGC 
ATCTGGCTGG GCCTGAGCCG CGGCGTGGTG AGCCTGCGCC CTTACGGCAC CCTGGCATCC 
ATCCACGACA TGGTGGCGCG CTCGGCCTTC ACTCAACTCG GCTATTCCGC ATGGTTGCTG 
CTGGCCGTGA CGGTGATCTT CATCGTCGCC TATGGCGGGC CGTTCGCTCT GCTGGGCCTG 
TCGCTCGCCC GACCATGGGC GCTGGCCGCC TGGGCAGCCA TGACGCTGAG CTACCTGCCG 
ATCTTGCGCT ATTACCGCAT GTCCCCGCTC TGGGCCTTGT TACTGCCCAT CAGCGCAGCG 
TTTTACCTTG GCATGACATG GAGCTCGGCC ATCCGTTATT GGCGCGGCGT ACGCTCACGT 
TGGAAAGGAC GAGTCTACAG CCATTGA

Protein sequence

MLTVLFAALP FMIWMGLLLA PWRPWSTRER LEVDSSPMPA ADLSGITVLI PARNEAETIG 
TILATLQKQG NGLQVVVVDD QSSDATASIA AAYPHTRVVS GRPLPEGWAG KLWALEQGKS 
QVHTAMTLLL DADIQLRPGL LPALLELKRR EGLHFVSLMA DLRRTSFWDR LLLPTFVYYF 
KLLYPFALSN SRSRHVAAAA GGCVLVDTEV LRHIGAFASL RNALIDDCTL ARQVKQAGYR 
IWLGLSRGVV SLRPYGTLAS IHDMVARSAF TQLGYSAWLL LAVTVIFIVA YGGPFALLGL 
SLARPWALAA WAAMTLSYLP ILRYYRMSPL WALLLPISAA FYLGMTWSSA IRYWRGVRSR 
WKGRVYSH