Gene Avin_31400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_31400
Symbol
ID	7762039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3246302
End bp	3247246
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	69%
IMG OID	643806014
Product	ABC nitrate/sulfonate/bicarbonate family transporter, periplasmic ligand binding protein
Protein accession	YP_002800278
Protein GI	226945205
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0670501
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTC CGCGTTTTCT GCGCAACGGC CTGGCCGGCC TGCTGCTGGT CGCGCCCCTG 
AGCCAGGCCG CCGACGCCGT GCTGCGCATC GGCGACCAGA ACTACTACAA CGTGCGCGCC 
TCGCTGGAGG CCTCCGGCGC GCTGGAGGGC GCCCCCTACC AGGTCGAATG GAAGCACTTC 
CAGTCCGCCG CGCCGCTGGC CGAGGGACTG GACGCCGGGG CGCTGGACCT CGGCTTTCTC 
GGCGACTCGG GATTCATCTT CCTCGCCGCC AAGGGTGCGC CGGTCAAGCT GATCGGCATC 
TCCCGGCAGA ACCCGGACAC CATCGCCCTG CTGGTGCCCA AGGACTCGCC GGCCAAGGGC 
ATCGAGGATC TCAAGGGCAA GAAGGTCGCC TACTGGCCGG GCGCCTGGAG CCAGCAACTG 
ACCCTGCGTG CCCTGCAGAA GGCCGGCCTG CCCGGCGATT ACGTCGAGTT CGTCAAACTG 
ATGCCGATCG ACGCCGCCGC CGCGCTGCCG CGGGGCAGCA TCGACGCCTT CCCGGTGTGG 
GAGCCGTACA TTTCCCAGCA GATCCTCTTC TCCGGCGCGC GCCCGCTGCT CACCTCCAAG 
GGCCTGATGC CGGGACTTTC CAGCATCGCC GCCAACGCCG CGTCCGTCGA GCCCAAGCGC 
GCCGCCATCG CCGATTTCCT CGGCCGCCTC AAGCAGGCGC GCGCCTGGGT CGAGACACAC 
AAGAGCGAGT ACGCCGAGCT CTGGGCGAAG AAGGCCAACC TCGACCCGGA GGTATCCCGC 
CACTGGATCG GCCAGGCCGA CATGACCGTG GGCCCGGTGG ACGACCAGGC CGCCCGCGAC 
TATCAGGAAA CCGCCGACTT CCTGCGGGAA ACCGGCGCCC TGCCCAAGGC CTTCAAGGTC 
GACACGGTGA TCGATTCCTC CTTCGCCCGA ACGCTGCAAC CCTGA

Protein sequence

MKFPRFLRNG LAGLLLVAPL SQAADAVLRI GDQNYYNVRA SLEASGALEG APYQVEWKHF 
QSAAPLAEGL DAGALDLGFL GDSGFIFLAA KGAPVKLIGI SRQNPDTIAL LVPKDSPAKG 
IEDLKGKKVA YWPGAWSQQL TLRALQKAGL PGDYVEFVKL MPIDAAAALP RGSIDAFPVW 
EPYISQQILF SGARPLLTSK GLMPGLSSIA ANAASVEPKR AAIADFLGRL KQARAWVETH 
KSEYAELWAK KANLDPEVSR HWIGQADMTV GPVDDQAARD YQETADFLRE TGALPKAFKV 
DTVIDSSFAR TLQP