Gene Avin_43620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_43620
Symbol
ID	7763235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	4407507
End bp	4408514
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	69%
IMG OID	643807217
Product	ribose ABC transporter
Protein accession	YP_002801458
Protein GI	226946385
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0182793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAC ACGACGGCAT TTCCCGGCGC GCCCTGCTCG GCGCCTCCTC GGCGCTGCTG 
GCGCTGGGGC TGGCCGCGCC CCTGGCGCGG GCCACGACGC AAGCCGCAGC GGAGGGCGAA 
GCGCCCTCGC TGGCCGGCAA GCGCATCGCC ATCAGCACCG TGGGCACCAG CATCTATTTC 
GACAGCCGCG CCTTCCAGGC GCAGGTGGAG GAGGTGCGGC GCCTGGGCGG CACGCCGATC 
ACCCTGGACG CCGGGCGCAA CGACAAGGCG CTGGTCACCC AGTTGCAGAA CCTGGTGACC 
CAGAAGCCCG ACGCGGTGAT CCACACCCTC GGCACCCTGA GCATCATCGA TCCCTGGTTC 
AAGCGCATCG CCGCCGCCGG CATCCCGCTG TTCACCATCG AGGTGCCCTC GCAGCACGCC 
GTCAACACGG TGTCGGCGGA CAACTGGAGC ACCGGACTGG TGCTGGCCAA GAAGCTGGTG 
GCGGACCTGC GCGGCAAGGG CCGGGTGCTG GTCTTCAACG GTTTCTACGG GGTGCCGAGC 
TGCGGTATCC GCTACGACCA GTTGAGGCTG GTGACCAAGT ACTACCCGCA GATCGAATTC 
CTCCAGCCGG AGCTGCGCGA CGTCATCCCC AACACCGTGC AGGACGCCCG CGCGCAGGTC 
GCCGCGCTGC TCAACAAGTA CCCGAAGGGC GAAATCGACG CCATCTGGAC CGCCTGGGAC 
CTGCCGCAAC TCGGCGCCAG CCAGGCGCTG ATCGAGGCCG GGCGCAAAGA GATCCGCACC 
TACGGCGTGG ATGGCACGCC CGAGGTGCTG GAACTGCTCA AACGGCCGGA CAGTCCGGTG 
GCGGCGGTGG TGGCGCAGCA GCCGGCGCTG ATCGGCCGCA TCGCGGTGCA CAACGTCGCC 
CGCTACCTGG CCGGTGAGCG CGATCTGCCG CGGGAAACCT TCGTCGACAC CCTGCTGACC 
ACCGCGGACA ACGTCGACGA GGTCAAGCGT CTCCGGGGCG ACGCATGA

Protein sequence

MNEHDGISRR ALLGASSALL ALGLAAPLAR ATTQAAAEGE APSLAGKRIA ISTVGTSIYF 
DSRAFQAQVE EVRRLGGTPI TLDAGRNDKA LVTQLQNLVT QKPDAVIHTL GTLSIIDPWF 
KRIAAAGIPL FTIEVPSQHA VNTVSADNWS TGLVLAKKLV ADLRGKGRVL VFNGFYGVPS 
CGIRYDQLRL VTKYYPQIEF LQPELRDVIP NTVQDARAQV AALLNKYPKG EIDAIWTAWD 
LPQLGASQAL IEAGRKEIRT YGVDGTPEVL ELLKRPDSPV AAVVAQQPAL IGRIAVHNVA 
RYLAGERDLP RETFVDTLLT TADNVDEVKR LRGDA