Gene Avin_40070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_40070
Symbol
ID	7762894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4061938
End bp	4062900
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	67%
IMG OID	643806867
Product	periplasmic sulfonate-binding protein of ABC transporter
Protein accession	YP_002801119
Protein GI	226946046
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTCCA TAACCTTCCA TCGGCGCCTG CTGGGGGCCC TGACGCTCGT CGCCGGCCTG 
GCGCTCGGGT TGCCCGGTGT CGCCAGCGCC GAGCAGCAGG CCCTGAAGAT CGGCTTCCAG 
AAGGGCGGCG GCCTGCTGGC GGTGCTGAAG TCCCAGGGCG TCCTGGAGAA ATCCCTGGGG 
GAACAGGGCT ACCGGGTGAC CTGGCACGAA TTCCAGGCCG GCCCGCAACT ACTCGAAGCG 
CTGAACGCCG GCAGCGTCGA TTTCGGCTAC ACCGGGGCGC CGCCGCCGAT CTTCGCCCAG 
GCGGCCGGTA TCGATCTGGT CTATGTCGGT GCCGAACCCC ACGCGCCGAG GACCGAGGCG 
ATCGTCACCC ACAAGGATTC GCCGATCGCC GACATCGCTG GGCTCAAGGG CAAGAAAGTG 
GCGGTGCAGA AAGGCTCCAG CGCCAACTAC CTGCTGGTGG CTTCGCTGGC CAAGGCCGGC 
CTGAGTTTCG CCGACATCCA GCCGGTCTAC CTGCCGCCGG CCGATGCCAG GGCGGCCTTC 
GAGAACCGCA GCGTCGATGC CTGGTCGGTA TGGGACCCTT ACCTGGCGGC CATCGAGAAG 
GGCGCATCGG TCAGGGTGCT GGGCAACTAC GAGGGGCTGT CGCAGACCAA CGCCTTCTAC 
GAGGCGTCGC GCCGTTTCGC CGAGACCAAT CCGAAGCTGC TCCAGGCGCT CCTGGGCGAG 
CTGGCCAAGG CCGGTGCCTG GGCCAACGAC AACCCCGGGG AGGTGGCGCG CCTGCTCGCC 
CCGCAACTGG GGTTGCCCGA GGATGTCCTG ACCCTTTGGC AGAAACGCGC CCGCTATGGC 
GTGCAACCCC TGTCGGCGGA GATCGTCGCG GTGCAACAGA AGGTCGCCGA TACCTTTCAT 
GAGCAGAAGC TGATCCCCAG GTCGGTGAAA GTCGGGGAGA TCGTCTGGAA GGCACCGCAA 
TAG

Protein sequence

MRSITFHRRL LGALTLVAGL ALGLPGVASA EQQALKIGFQ KGGGLLAVLK SQGVLEKSLG 
EQGYRVTWHE FQAGPQLLEA LNAGSVDFGY TGAPPPIFAQ AAGIDLVYVG AEPHAPRTEA 
IVTHKDSPIA DIAGLKGKKV AVQKGSSANY LLVASLAKAG LSFADIQPVY LPPADARAAF 
ENRSVDAWSV WDPYLAAIEK GASVRVLGNY EGLSQTNAFY EASRRFAETN PKLLQALLGE 
LAKAGAWAND NPGEVARLLA PQLGLPEDVL TLWQKRARYG VQPLSAEIVA VQQKVADTFH 
EQKLIPRSVK VGEIVWKAPQ