Gene Avin_50310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_50310
Symbol
ID	7763881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	5099570
End bp	5101141
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	67%
IMG OID	643807861
Product	ABC transporter ATP-binding protein
Protein accession	YP_002802095
Protein GI	226947022
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.433727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGATCG TGAACATGCT CAGCACTGCA CCCAGCACTC ATGGCGTCAT GACCCAACTG 
CCGACAGCCA TGGCTCCCGA GTACCTGCTC GAAATCGTCA ATGTCACCAA GAGCTTTCCC 
GGCGTGGTGG CGCTTTCCGA TGTCCAGTTG CGCGTGCGTC CCGGCACCGT GCTGGCGCTG 
ATGGGGGAGA ACGGCGCGGG CAAGTCGACG CTGATGAAGA TCATCGCCGG CATCCACCAG 
CCGGACACCG GCGAGCTGCG CCTGCGCGGC CAGGCGGTCA GCTTCGAGAC GCCGCTCGCC 
GCCCTGCAGG CCGGCATCGC GATGATCCAC CAGGAACTCA ACCTGATGCC CTTCATGAGC 
ATCGCCGAGA ACATCTGGCT CGGCCGCGAG CCGCTCAACG CCATGCGCAT GGTCGACCAC 
CGCAGGATGC ACCGGCAGAC CAGGGAACTG TTCGAGCGCC TGCGCATCGA CCTCGACCCC 
GAGGCGCCGG TCGGCAGCCT GAGCATCGCC GGGCGGCAGA TGGTGGAGAT CGCCAAGGCG 
GTGTCCTACG ACAGCGACGT GCTGATCATG GACGAGCCGA CCTCGGCGAT CACCGACAAG 
GAGGTCGCGC ACCTGTTCTC GATCATCGCC GACCTCAAGG CCGCGGGTAA GGGCATCATC 
TACATCACCC ACAAGATGGA CGAGGTGTTC GCCATCGCCG ACGAGGTGGC GGTGTTCCGC 
GACGGCGCCT ACATCGGCCT GCAGAGCGCC GACAGCATGG ACGGCGACGG GCTGATCTCG 
ATGATGGTCG GCCGCGAACT CACCCAGCTC TTCCCCGAGC GCCGCGCGCC GCGCGACCAG 
GTGGTGCTCT CGGTGCGCGA CCTGGGCCTG GAGGGCGTGT TCCAGGGCGT GTCCTTCGAC 
CTGCGCGCCG GCGAGGTGCT GGGCATCGCC GGGCTGATGG GCGCCGGGCG CACCAACGTG 
GCGGAAACCC TGTTCGGCGT CACCCCGGCC AGCCAGGGCG AAATCCGCAT CGACGGCGAG 
CCGGTGAACA TGAACGATCC CTGCCTGGCG ATCCGCAAGG GCCTGGCGCT GCTCACCGAG 
GACCGCAAGG ACACCGGCAT CTTCGCCTGC CTGTCGGTGC AGGAGAACAT GGAGGTCACG 
GTGCTGCCCA ACTTCGCCAG CCGCGGCTTC GTGCAGCGCC AGCGCCTGCG CGAGCTGTGC 
GAGGAGATGC GCCGCAAGCT GCGCGTCAAG ACCCCCTCGC TGGAGCAGTG CATCGCCAAC 
CTGTCCGGCG GCAACCAGCA GAAGGCCCTG CTGGCGCGCT GGCTGATGAC CCAGCCGCGC 
GTGCTGATCC TCGACGAGCC CACCCGCGGC ATCGACGTCG GCGCCAAGGC CGAGATCTAC 
AAGCTGATCG CCGAACTGGC CGCCGAAGGC ATGGCGGTGA TCATGATCTC GTCCGAACTG 
CCGGAAGTGC TGGGCATGAG CGACCGGGTC ATGGTCATGC ACGAGGGCGC GGTGACCGGC 
ATCCTCGAGC GCGACGAAGC CACCCAGGAG CGGGTGATGC AACTGGCTTC GGCGACCCCT 
TCCGTTCACT GA

Protein sequence

MEIVNMLSTA PSTHGVMTQL PTAMAPEYLL EIVNVTKSFP GVVALSDVQL RVRPGTVLAL 
MGENGAGKST LMKIIAGIHQ PDTGELRLRG QAVSFETPLA ALQAGIAMIH QELNLMPFMS 
IAENIWLGRE PLNAMRMVDH RRMHRQTREL FERLRIDLDP EAPVGSLSIA GRQMVEIAKA 
VSYDSDVLIM DEPTSAITDK EVAHLFSIIA DLKAAGKGII YITHKMDEVF AIADEVAVFR 
DGAYIGLQSA DSMDGDGLIS MMVGRELTQL FPERRAPRDQ VVLSVRDLGL EGVFQGVSFD 
LRAGEVLGIA GLMGAGRTNV AETLFGVTPA SQGEIRIDGE PVNMNDPCLA IRKGLALLTE 
DRKDTGIFAC LSVQENMEVT VLPNFASRGF VQRQRLRELC EEMRRKLRVK TPSLEQCIAN 
LSGGNQQKAL LARWLMTQPR VLILDEPTRG IDVGAKAEIY KLIAELAAEG MAVIMISSEL 
PEVLGMSDRV MVMHEGAVTG ILERDEATQE RVMQLASATP SVH