Gene Avin_29990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_29990
Symbol
ID	7761900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3105023
End bp	3106159
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	72%
IMG OID	643805872
Product	Glycosyl transferase, group 1 family protein
Protein accession	YP_002800140
Protein GI	226945067
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCT CGCCCCGATC GGTCGTCCAC CTGCTCGCCT CGCTGGACTT CGGCGGCGTG 
GAACGGCGCA TGGAACTGCT GGCCGAGCAG CCCGCCGGCG ACATACGGCA TCTGTTCTGC 
GCCATCGGCG GCGGCGGCAA TGCCGAACGC CGCCTGCAGA GCCTCGGCGC TCCGGTCCGC 
TGCCTGCACC AGCCGACGGC GATCCCCAGT CCGGCCGCGA TCCTCGCGCT CGTCCGCCTG 
CTCCGCCGGC TGCGCCCGAC GGTGCTGCAC GCCCACGGCG CCGAGGCTAA CTTCCACGGT 
CTGATCGCCG CCCGGCTGGC CGGGGTGCCG GTGCGGATCG CCGAGGAGAT CGGCATCCCG 
ACGCACAGCG CGCGGGCCCG CCGGGTGTTC CGCCAGCTCT ACCGCAGCGC CCACTGCGTC 
GTCGGCATCT CCGACGCGGT GACCGGCTGG CTGGTCGACA GCGGCGAAGT GCCGCCGGAC 
AAGGCGATCC GCATCTACAA CCCGGTCAAG CTGCCGGACC GGCACGACCG GCAGGCAGCG 
CCGGAGGACG GGCTGCGCAT CGCCTTCGTC GGCCGTCTCG AAGCGGTCAA GAACCCCCTG 
GCGCTGGTCG AGGCCGCCGC CCTGCTGCTG GCCCGCGGGA TTCCCGTGGA ACTCTGGCTG 
ATCGGCGAGG GCCGCGAGCG GCAGCGCCTG GAAGCCATGG TCCGCGCCCG GGGACTGGAC 
AGGCGCGTGC ATCTGCCGGG CTACCGGGCG CATCCCGAGG CGTACGTGCG CCGCTGCCAC 
CTCTATGTCC AGCCCTCGCG CTCCGAAGGC TTCGGCCTGG CGCTGGTCGA GGCCATGGGC 
TGCGGCCTTC CGGTCGTCGC CACGGCGGTG GGCGGCGCGC CGGAGATCGT CGAGTCCGGC 
GTCACCGGCT GGCTGCTGCC GGAAGCGACG CCGGCCGCCC TCGCCGATGT CCTCGAAGCG 
GCCTGGCGGC TCGGCCCGCG ACGGCTGGAA AGCATGGGCG AACGGGCCCG CGGCGCCGTC 
GAGGGACGTT TCGAACCAGC CCGCTACAAG GCCCGGCTGG AAACCCTGTA CCGACGATTC 
ACCCCGCGAA AGGCCAAAGG CGAGCATGGA AAAGATTCGG ATTCTGCACT GTCTTGA

Protein sequence

MSASPRSVVH LLASLDFGGV ERRMELLAEQ PAGDIRHLFC AIGGGGNAER RLQSLGAPVR 
CLHQPTAIPS PAAILALVRL LRRLRPTVLH AHGAEANFHG LIAARLAGVP VRIAEEIGIP 
THSARARRVF RQLYRSAHCV VGISDAVTGW LVDSGEVPPD KAIRIYNPVK LPDRHDRQAA 
PEDGLRIAFV GRLEAVKNPL ALVEAAALLL ARGIPVELWL IGEGRERQRL EAMVRARGLD 
RRVHLPGYRA HPEAYVRRCH LYVQPSRSEG FGLALVEAMG CGLPVVATAV GGAPEIVESG 
VTGWLLPEAT PAALADVLEA AWRLGPRRLE SMGERARGAV EGRFEPARYK ARLETLYRRF 
TPRKAKGEHG KDSDSALS