Gene Avin_31680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_31680
Symbol
ID	7762068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	3277533
End bp	3278507
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	70%
IMG OID	643806042
Product	ABC transporter, aliphatic sulfonate substrate-binding protein
Protein accession	YP_002800306
Protein GI	226945233
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCCGT TCGTCTCTCT CAGCCGCCGC GCTCTGCTCG GTCTCGGCCT CGCCCTGGGG 
CTGTGCGCCG CCCTGCCCGC CCAGGCGGAA ACCGAGCTGC GCATCGGCTA CCAGAAATCC 
TCCACCCTGA TCGTCCTGCT GAAGGCCCGC GGCACCCTGG AAAAGACCTT GTCCGCCCAG 
GGTATCCGCC TCAGTTGGCA CGAGTTCACC AGTGGCCAGC CGCTGCTGGA GGCGCTCAAC 
GTCGGCAACC TGGACCTGAC CGCCGATGTC GCCGATACCG TGCCGGTGTT CGCCCAGGCC 
GCCGGCGCCC ATCTCGCCTA TTTCGCCCAG GAGGCGCCAT CGCCGGCCGC CCAGGCGATC 
CTGGTGCGCG CCGACTCGCC GCTGCGCGGT CTGGCCGATC TCAAGGGCAA AAGGGTGGCG 
GTGACCAAGG CCGCCGGCAG CCACTACCTG CTGCTCGCCG CACTGGCCGA GGCCGGTCTG 
AAGTTCTCCG ACATCGAGCC GGCCTACCTG ACCCCGGCCG ACGGCCGCGC CGCTTTCGAG 
AATGCCAAGG TGGACGCCTG GGTGACCTGG GAACCCTTCC TCAGCGGCGC CCAGCGCCAG 
TTGCCGACCC GCACCCTGGC CGACGGCGAG AAGCTGGCCG CCTACCAGCG CTACTACCTG 
ACCAGCCAGC GCTTCGCCAA GGAGCACCCG CAGGTGCTGG AGGCGGTGTT CGCCGAGCTG 
GTCAAGGCCG GCGACTGGCT GCGCGCCAAT CCCCGGGAAG CCGCACGGAT TCTCGCGCCG 
CTATGGGGCA ACCTGGACCC GGCGATCGTC GAACAGGCCA ACGCCCGACG CAGCTACCGG 
GTACGTCCGG TACAGCTGGA GAGCCTGGCC GAGCAGCAGA AGATCGCCGA CGCCTTTTTC 
GCCGAAGGGC TGCTGCCGAA GCAGGTCGAC GCCCGCGACG TGTCCATCTG GCAACCGCAG 
ACGGCCGCCC GCTGA

Protein sequence

MPPFVSLSRR ALLGLGLALG LCAALPAQAE TELRIGYQKS STLIVLLKAR GTLEKTLSAQ 
GIRLSWHEFT SGQPLLEALN VGNLDLTADV ADTVPVFAQA AGAHLAYFAQ EAPSPAAQAI 
LVRADSPLRG LADLKGKRVA VTKAAGSHYL LLAALAEAGL KFSDIEPAYL TPADGRAAFE 
NAKVDAWVTW EPFLSGAQRQ LPTRTLADGE KLAAYQRYYL TSQRFAKEHP QVLEAVFAEL 
VKAGDWLRAN PREAARILAP LWGNLDPAIV EQANARRSYR VRPVQLESLA EQQKIADAFF 
AEGLLPKQVD ARDVSIWQPQ TAAR