Gene Sros_6741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6741
Symbol
ID	8670050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	7418496
End bp	7419611
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	67%
IMG OID
Product	D-xylose-binding periplasmic ABC transporter protein
Protein accession	YP_003342193
Protein GI	271967997
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.177383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGG GGATCCTCAG CCTGACCGCC GCCGCTGCGG CGATGACCCT CGGTCTCACC 
GCCTGCGGGG GCGAGAGCGG CGACACCACC ACCGCCCAGA ACAGCGCCGC CCCCGCCGAG 
AGCAAGGCCG CCGGAAAGGT CGGCGTCATC CTGCCGGACA GCAAGTCCTC CGCCCGCTGG 
GAGACCGCGG ACCGCAAGTA CCTGGAGGAG GCGTTCAAGG CCGCGGGCGT CGCCTACGAC 
ATCCAGAACG CCCAGGGTGA CAAGACCCAG TTCCAGACCA TCGCCGACCA GATGATCACC 
AATGGCGCGA CCGTGCTGAT GATCGTCAAC CTGGACAGCG GCACCGGCAA GGCCGTGCTC 
GACAAGGCCA AGGCCCAGGG TGTGGCCACC ATCGACTACG ACCGCCTCAC CCTCAACGGC 
GGCGCCTCCT ACTACGTCAG CTTCGACAAC ACCAAGGTCG GCACCCTGCA GGGTGAGGGC 
CTGGTGAAGT GCCTGACCGA CAAGAAGGCC GACAAGCCGA TCGTGGCCGA GCTCAACGGC 
TCGCCCACCG ACAACAACGC CACGCTGTTC AAGAACGGCT ACGACGGCGT GCTCAAGCCC 
AAGTACGACG CCAAGGAGTA CGTCAAGGGC CCGGACCAGT CCGTGCCGGA CTGGGACAAC 
GCGCAGGCGG GCACGATCTT CGAGCAGATG CTCACCGAGC AGCCGAAGAT CGCCGGCGTG 
CTGGCCGCCA ACGACGGCCT GGGCAACGCC GCCATCGCCG TGCTGAAGAA GAACAGCCTC 
AACGGCAAGG TCCCGGTCAC CGGCCAGGAC GCCACCGTGC AGGGTCTGCA GAACATCCTC 
GCCGGCGACC AGTGCATGAC GGTCTACAAG GCGATCAAGA AGGAGGCCGA CGCGGGGGCC 
GCGCTCGCCA TCGCGCTGGC CAAGGGTGAG AAGCCCGCGG CCTCCGGTTC GGTGAAGGAC 
ACCGAGAGCG GCGCGGACGT GCCGGCGGTC CTGCTCGACC CGCAGGCCAT CTTCTTCGAC 
AGCGTCAAGG ACGTCGTGGC AGACGGGTTC GTGACCAAGG ACGAGCTGTG CGCCGGCGAG 
TTCGCCGCCA AGTGCACCGA GGCCGGAATC CAGTAA

Protein sequence

MRKGILSLTA AAAAMTLGLT ACGGESGDTT TAQNSAAPAE SKAAGKVGVI LPDSKSSARW 
ETADRKYLEE AFKAAGVAYD IQNAQGDKTQ FQTIADQMIT NGATVLMIVN LDSGTGKAVL 
DKAKAQGVAT IDYDRLTLNG GASYYVSFDN TKVGTLQGEG LVKCLTDKKA DKPIVAELNG 
SPTDNNATLF KNGYDGVLKP KYDAKEYVKG PDQSVPDWDN AQAGTIFEQM LTEQPKIAGV 
LAANDGLGNA AIAVLKKNSL NGKVPVTGQD ATVQGLQNIL AGDQCMTVYK AIKKEADAGA 
ALAIALAKGE KPAASGSVKD TESGADVPAV LLDPQAIFFD SVKDVVADGF VTKDELCAGE 
FAAKCTEAGI Q