Gene Avin_50300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_50300
Symbol
ID	7763880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	5098472
End bp	5099503
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	67%
IMG OID	643807860
Product	ABC transporter permease
Protein accession	YP_002802094
Protein GI	226947021
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGAACA TGAGTGCCAT CCTGGAAAAG AGCCCCCTTG CGAACCTGTC GCTCTGGAGC 
CGGCGCCTGC CGGCCGAGCT GAGCATCCTG CTGGTGCTGA TCGGCATCGG CCTGGTCTTC 
GAGCTGTTCG GTTGGGTGAT GCGTGACCAG AGCTTTCTGA TGAACTCCCA GCGCCTGGTG 
CTGATGATCC TGCAGGTATC GGTCATCGGC CTGCTGGCCA TCGGCGTGAC CCAGGTGATC 
ATCACCACCG GCATCGACCT GTCCTCCGGC TCGGTGCTGG CGCTCTCGGC GATGGTGGCG 
GCGAGCCTGG CGCAGACTTC CGAGTTCGGC CGCGCGGTGT TCCCGGCGTT GACCGACCTG 
CCGGCCTGGG TGCCGGTCAT GGCCGGCATC GGCGTGGGAT TGTTGGCGGG GCTGGTCAAC 
GGCAGCCTGA TCGCCGCCAC CGGCATCCCG CCGTTCATCG TCACCCTGGG CATGATGGTT 
TCGGCCCGCG GCCTGGCCCG CTACTACACG GAAGGCCAGC CGATCAGCAT GCTTTCCGAC 
TCCTACACCG CGATCGGCAG TGGCGCCATG CCGGTGATCA TTTTCCTGGT GGTGGCGGCG 
ATCTTCCACA TCGCCCTGCG CTACACCAAG TACGGCAAGT ACACCTACGC CATCGGCGGC 
AACATGCAGG CGGCGCGCAT CTCCGGGATC AACGTCAAGC GCCACCTGAT CATCGTCTAC 
AGCATCGCCG GGCTGCTGGC CGGTCTGGCC GGCGTGGTCG CCTCGGCCCG CGCCGCCACC 
GGGCAGGCCG GGATGGGCCT GTCCTACGAA CTGGACGCCA TCGCCGCGGC GGTGATCGGC 
GGCACCAGCC TGGCCGGCGG CATGGGCCGT ATCACCGGCA CCGTGATCGG CGCGCTGATC 
CTCGGCGTGA TGGCCAGCGG CTTCACCTTC CTCGGCGTGG ACGCCTACAT CCAGGACATC 
ATCAAGGGCG TGATCATCGT CGTCGCCGTG GTGGTCGACC AGTACCGCAA CAAGCGCAAG 
GTCAAGCGCT GA

Protein sequence

MWNMSAILEK SPLANLSLWS RRLPAELSIL LVLIGIGLVF ELFGWVMRDQ SFLMNSQRLV 
LMILQVSVIG LLAIGVTQVI ITTGIDLSSG SVLALSAMVA ASLAQTSEFG RAVFPALTDL 
PAWVPVMAGI GVGLLAGLVN GSLIAATGIP PFIVTLGMMV SARGLARYYT EGQPISMLSD 
SYTAIGSGAM PVIIFLVVAA IFHIALRYTK YGKYTYAIGG NMQAARISGI NVKRHLIIVY 
SIAGLLAGLA GVVASARAAT GQAGMGLSYE LDAIAAAVIG GTSLAGGMGR ITGTVIGALI 
LGVMASGFTF LGVDAYIQDI IKGVIIVVAV VVDQYRNKRK VKR