Gene Avin_30100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_30100
Symbol
ID	7761911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3118988
End bp	3119998
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	52%
IMG OID	643805883
Product	Glycosyl transferase, family 2 protein
Protein accession	YP_002800151
Protein GI	226945078
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGAACG CGATAGCCGT CTCGGTCATA GTGCCCGTCT ACAATGCCGA ACGCCATATC 
GAGCGCACGC TCGACAGTCT GGCCAGCCAG TCGCTCGAAA ATATCGAGGT CATCGTAGTG 
GATGATGCGT CCACGGATAA ATCATCGCAA ATTATCCGCT CGAAGGAAAA AAGCCTCAAT 
CTCGTTTATT TTCGCCAGAC TGTGAATCAG GGTGCCCATA ATGCACGCCT GCAAGGCTTG 
CAACATGCCC GCGGGGCATG GATAGGCTTT CTCGACGCCG ATGACGTGGC TCATCCCGAC 
ATGTTCGGTT CGATGCATGA GGTGGCCAGC GAGCACCTGT CCGATATAGT CGTGTGTGGC 
TCATATCGCG TAGCCGAGTC TGGAGAACGC CTGGGCACGA AAATCAGTTT CGTTGAGAAC 
ACCGAAATAA GTACAGATGT ATTTGGCAGG TTTTGCCGCT TCGAATTCGG AACCGGAATG 
CTGTGGAACA AGCTCTATCG AAGGGAAATC ATCCTACCGT TCAAGGAAAT GGACTTTCCC 
TGGCGACAGA ATCTCAATGA AGACCTGCTG CTGAACATAG GCTGCTTTTC ACGGGCGTCC 
ACGATTTACC TCATGAAAGA TATTCTTCAC GACTATACCC ACAACCGAAC CAGCGCCACG 
TCGATCACTG GTCGCCCCAA GGCATATGTG GAGACCTATA GAGCCTATGC CGTCGCCGTC 
AGCAGATTTT CCGAGCTGGG CGCCGGTGCG CTGGAAAATA TTACCGAAAT GTACAGAACC 
CAACTGAGAT GGGGGAATTA CAACATCAAC AACCTTGAAG AGCTTTCCGA ATACAGGGAG 
GAACTCCAAC AGGCCACGAA CATGCTATAC CGACACTACC CACATGGGCT TGCCCTGCTT 
GCCGCACGCC CCGAGCGCAA GCCTCCCGTC GAACAGCCCA TCATGAAGAA AATCACCAGA 
AAGCTTATTA GAACATTGCA ATCCATGGAG ATCCTGAAAA CTCCCAGATA G

Protein sequence

MKNAIAVSVI VPVYNAERHI ERTLDSLASQ SLENIEVIVV DDASTDKSSQ IIRSKEKSLN 
LVYFRQTVNQ GAHNARLQGL QHARGAWIGF LDADDVAHPD MFGSMHEVAS EHLSDIVVCG 
SYRVAESGER LGTKISFVEN TEISTDVFGR FCRFEFGTGM LWNKLYRREI ILPFKEMDFP 
WRQNLNEDLL LNIGCFSRAS TIYLMKDILH DYTHNRTSAT SITGRPKAYV ETYRAYAVAV 
SRFSELGAGA LENITEMYRT QLRWGNYNIN NLEELSEYRE ELQQATNMLY RHYPHGLALL 
AARPERKPPV EQPIMKKITR KLIRTLQSME ILKTPR