Gene Sros_6217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6217
Symbol
ID	8669522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6825633
End bp	6827114
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	71%
IMG OID
Product	L-arabinose isomerase
Protein accession	YP_003341689
Protein GI	271967493
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.620258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGGTCT GGTTTCTCAC CGGCAGTCAG GGGCTTTACG GCGAGGACAC GCTGCGCCAG 
GTGGCCGAGC AGTCCCAGCG GATCGCCGCG GCCCTGGACG AGGCGCTCCC CTTCGAGGTC 
GAGTGGGAGC CGGTGCTCAC CGACGCCGCG GCGATCCGCA GGATGTGCCT GGAGGCGAAC 
TCCTCCGACG AGTGCGTCGG GCTGATCGCG TGGATGCACA CCTTCTCCCC GGCCAAGATG 
TGGATCGCCG GCCTGGACGC CCTGCGCAAG CCGCTGCTGC ACCTGCACAC CCAGGCCGAC 
CTGGAACTGC CGTGGAGCTC CATCGACATG GACTTCATGA ACCTGAACCA GGCGGCGCAC 
GGTGACCGCG AGTTCGGCTA CATCCAGGCC AGGCTCGGAG TGCCCCGCAA GACCGTGGCC 
GGCCACGTGA GCGACCCCTC CGTGGCGGCG CGGATCGAGG CGTGGGCCAG GGCGGCGGCA 
GGCCGGGCCG AGGTGGGCTC GCTCAGGCTG GCCAGGTTCG GCGACAACAT GCGCGACGTG 
GCGGTGACCG AGGGCGACAA GGTCGAGGCC CAGCTCCGGT TCGGCGTGTC GGTCAACACC 
TACGGCGTCA ACGACCTGGT GGCCGCGGTC GACGCCTCCT CCGACACCGA GGTCGCCACG 
CTGGTCAAGG AGTACGAGGA CCTGTTCCAG GTCGCCCCCG AGCTGCGCGC CGGCGGCGAG 
CGGCACGACT CCCTGCGCTA CGCGGCCCGG ATCGAGCTGG GCCTGCGCCA CTTCCTGGAG 
GCGGGCGGGT TCAAGGCGTT CACCACCAAC TTCGAGGACC TCGGCGGGCT GCGGCAGCTA 
CCGGGCCTGG CCGTGCAGCG CCTGATGGCC GACGGCTACG GCTTCGGTGG CGAGGGCGAC 
TGGAAGACCT CGGTGCTGCT GCGCACGCTG AAGGTGATGT CGGCCGGACT GCCGGGCGGA 
ACCTCGTTCA TGGAGGACTA CACCTACCAC CTGACGCCGG GACAGCAGCT CATCCTCGGC 
GCGCACATGC TGGAGGTCTG CCCGACGATC GCCTCGGGCG TCCCGTCGTG CGAGATCCAC 
CCGCTCGGCA TCGGCGGCCG GGAGGATCCG GTCCGGCTGG TGTTCGACGC CGAGCCCGGC 
CCCGCCGTCG TCGTCGGCCT GGCCGACATG GGGGAGCGGT TCCGGCTGGT CGCCAACGAG 
GTCGACGTGG TCGCCCCGGT CGAGCCGCTG CCGAACCTGC CCGTGGCCAG GGCGGTCTGG 
AGGCCCCGGC CCGACCTGCG CACCTCGGCC GAGGCGTGGC TCACCGCCGG CGCCCCGCAC 
CACACCGTCC TGTCGGCCGC GGTCGGCGCC GAGGAACTCA CCGACTTCGC CGACATGCTC 
GGTGTCGAAC TGCTCGTCAT CGACGCCGAC ACCACGCCAC GCGGGTTCGC CAAGGAACTG 
CGCTGGAACC AGGCCTACTA CCGCCTCGCC CAGGGATTCT GA

Protein sequence

MKVWFLTGSQ GLYGEDTLRQ VAEQSQRIAA ALDEALPFEV EWEPVLTDAA AIRRMCLEAN 
SSDECVGLIA WMHTFSPAKM WIAGLDALRK PLLHLHTQAD LELPWSSIDM DFMNLNQAAH 
GDREFGYIQA RLGVPRKTVA GHVSDPSVAA RIEAWARAAA GRAEVGSLRL ARFGDNMRDV 
AVTEGDKVEA QLRFGVSVNT YGVNDLVAAV DASSDTEVAT LVKEYEDLFQ VAPELRAGGE 
RHDSLRYAAR IELGLRHFLE AGGFKAFTTN FEDLGGLRQL PGLAVQRLMA DGYGFGGEGD 
WKTSVLLRTL KVMSAGLPGG TSFMEDYTYH LTPGQQLILG AHMLEVCPTI ASGVPSCEIH 
PLGIGGREDP VRLVFDAEPG PAVVVGLADM GERFRLVANE VDVVAPVEPL PNLPVARAVW 
RPRPDLRTSA EAWLTAGAPH HTVLSAAVGA EELTDFADML GVELLVIDAD TTPRGFAKEL 
RWNQAYYRLA QGF