Gene Svir_33020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_33020
Symbol
ID	8388626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	-
Start bp	3582677
End bp	3584017
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	66%
IMG OID	644977326
Product	arabinose efflux permease family protein
Protein accession	YP_003135095
Protein GI	257057263
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.471979
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCCA CTTCGATATC GCCGGACAAG GCGAAGAAGG CGAGAACCGT CGCGGTCGCC 
AGCTACATCG GCACGACCAT CGAGTGGTAC GACTTCTTCA TCTACGGCGT CGCCGCGACG 
CTGGTCTTCC GCACCCAGTT CTTCCCGGAG TTCTCCGAAC TCGGGGGTAC GCTGGCCGCG 
CTTGCGACCT TCGCGGTCGG TTTCATCGCA CGTCCCATCG GCGGGATCGT GATGGGGCAC 
TTCGGTGACC GGGTCGGTCG TAAGTCGATG CTCGTCACCT CGCTGCTGAT CATGGGCATC 
GCGACGACCC TCATCGGCGT GCTCCCGACG TACGACCAGA TCGGTGTCTG GGCGCCCATC 
CTGCTCGTCG TGCTGCGGCT CGCCCAGGGC GCCGGTGTCG GGGGTGAATG GGCGGGTGCG 
GTGCTGATGG CCGTCGAGCA CGCACCGCCG AAGCGACGGT CGTTGTACGG CTGCTTCCCG 
CAGTTGGGTC TGCCCTCGGG AATCCTGCTG TCCCAGTTGG TCTTCCTCGT GCTCACGGGC 
GTGTTGCCGG AGGCTGCGTT CAGCGCCTGG GGTTGGCGTA TCCCCTTCCT GATCAGCGCG 
GCGTTGATCC TGGTCGGACT GCTCATCCGG CTGCGGATCG AGGAGAGCGC GGACTTCGAA 
CGCGTCCGCG CGGCGGGGCA GGTCGAGAAG CTGCCGGTGG TGCAGGTCTT CCGGCGTACC 
CCGCTGCAGG TGCTCGTGGG TAGCGTGGCT TCGATCGCCG CTCCGACCCT GGGCTACCTG 
GTGTCGGTCT ACATGGTGTC CTACGGCACC AACACCCTCG AGCTGCCCAC GACGACCATG 
CTGTGGACGC TCGTCGGCGT GAGCGTGTTG TGGAACGGCA TCATGTTGGC GGCCGGTCTG 
GCCGGTGACG TGCTGGGCCG CAAGCCGACG TTCCTCATCG GGGCCGCGCT GTCGGTGGTG 
TGGGCCTTCC CGATGTTCTG GCTCGTGGAC ACCGGGTCCC TCTTCTGGAT CTTCGTGGCC 
CTGGTCGTCA TCACCGCGGC CAACTCCATC ATGGCGGGAC CGCAGCCGGC ACTGGTCACG 
GAGATGTTCC CCGTTCGGCT GCGCTACAGC GGGTCGTCGA TCTGCTACCA GATCGGATCG 
ATCATCGGCG GCGGTGTGGC CCCGATCCTG GCGACGACAC TGTTCGCCAA GTTCGGCAAC 
CCCGCGGTCT CGACGCTGAT CGTCGTCATC TCGCTGCTCA GTCTGTTCGC GATCCTGTTC 
GCGGGCCAGC GGATCCTGCA AGCACAGGAA CCGACGGCCC CGCAGGCCCA GCAGAGCCGA 
CTGCAACCGC TCGCCGAGTG A

Protein sequence

MSSTSISPDK AKKARTVAVA SYIGTTIEWY DFFIYGVAAT LVFRTQFFPE FSELGGTLAA 
LATFAVGFIA RPIGGIVMGH FGDRVGRKSM LVTSLLIMGI ATTLIGVLPT YDQIGVWAPI 
LLVVLRLAQG AGVGGEWAGA VLMAVEHAPP KRRSLYGCFP QLGLPSGILL SQLVFLVLTG 
VLPEAAFSAW GWRIPFLISA ALILVGLLIR LRIEESADFE RVRAAGQVEK LPVVQVFRRT 
PLQVLVGSVA SIAAPTLGYL VSVYMVSYGT NTLELPTTTM LWTLVGVSVL WNGIMLAAGL 
AGDVLGRKPT FLIGAALSVV WAFPMFWLVD TGSLFWIFVA LVVITAANSI MAGPQPALVT 
EMFPVRLRYS GSSICYQIGS IIGGGVAPIL ATTLFAKFGN PAVSTLIVVI SLLSLFAILF 
AGQRILQAQE PTAPQAQQSR LQPLAE