Gene Sros_1267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1267
Symbol
ID	8664542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1301400
End bp	1302815
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	70%
IMG OID
Product	protein of unknown function DUF201
Protein accession	YP_003337008
Protein GI	271962812
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACTA ATATCCCGTT CGGGGAGAAG CATTCCAGAT TAAGCATCTT CGAACCGAAC 
GAGGGGACCC TGGTGGTCAT CCCGTCACTC TCGCTTCCCC AGGACGAGCT GCGCAGGATC 
ACCGGCGCCC TGTGCTACGA GGAGCGGCTG CTGTTCCTCC TGCTCACCCT CAGGCAGCCG 
GACGTCGAAG TCGTCTACCT GTCCTCCGTT CCGGTGGACA CCGCGATCGT GGACTACTAC 
CTGGGCTTCC TCGACGACCC CGACGAGGCG CGCACCCGCC TGCAAATGAT CAGTTTGGAC 
GAGCCGCGCA CGGGGCCGCT CACCATGTCG CTGCTGCACC GCCCGGATGT CATCGCGCGG 
ATCCGCGCGG CGCTCGGCCG TACGGCGGGC GCCTGGATGG TGCCGTTCGT GGTCAGTGAG 
GCCGAGGAGC GGCTCGCCGA GATCCTCGGC CTGCCGATCT ACGGCCCGGC CACCTCGCTG 
GCCCACCTCG GGTCCAAGAG CGGCGGACGC ATGATCGCCG AGGAGGCGGG GGTGCCGATG 
GCCCGGGGCT TCGCCGACCT GCGGTCGCTG ACCGAGGTGG AGCACGCGGC CCGCGCGCTG 
AGCCCCAGGT CCAAGCTGAT GGTCAAGCTC AACAACAGCT ACTCCGGGCT GGGCAACGCC 
GTCGTGATCA AGGACGAGCG GCCGCTCACC GCCTGCCACA CGAGCTTCTC GGCGGCGGAC 
GAGAACTGGA CGACGTTCGC CGAGAAGATC GCCGAGCGGG GCGCGGTGAT CGAGGAGTTC 
ATCGAGGACC GGCCGCTGCA CTCCCCCAGC GCCCTGGCCA GGATCACCCC CGGCGGCGCC 
TATGACGTGG TCGCCACCCA CGAGCAGCTT CTCGGCGGCC CGAACGGCGA CCTCTACCAG 
GGCTGCGCCT TCCCCGCCCG GCCGGAGTAC CGGGCCCAGG TGGGCGAGTG CGCCGAGCGG 
ATCGCCCGGG TCCTCGCGGG CCGGGGCGTG GTGGGCCTGT TCGGCATGGA CTTCTTCGCC 
GTCAAGACCG ACGCCGGCTA CCGGGCCCTG CTGTGCGAGA TCAACCTGCG GATCGGGGGC 
ACCACGCACC CGTTCGGCGC CGCCCTGCTC ACCACCGGCG CCTCCTACGA TCCCGGCACC 
GGCACGCTCG TGCACGGCGG CCGGTCGAAG TACTACGTGG CGACCGACAA CTGCACCGCC 
GCCTGCCTGC GGGGCCGTAC GCCCGCGGAG GTCGTCAAGC TGATCGACGA CAGGGGTCTC 
GGCTTCGACC GCGAGGCCCG CACGGGCAAC GTGCTGCACC TGCTCGGCGC GGTCCCGGAG 
TACGGCAAGC TCGGTTTCAC CAGCATCGGC GACTCGGCCG AGGAGGCCGC CGAGCTACAC 
CGGAGGACCC TGCGGGCGCT TAACCAGTCC GCGTAG

Protein sequence

MITNIPFGEK HSRLSIFEPN EGTLVVIPSL SLPQDELRRI TGALCYEERL LFLLLTLRQP 
DVEVVYLSSV PVDTAIVDYY LGFLDDPDEA RTRLQMISLD EPRTGPLTMS LLHRPDVIAR 
IRAALGRTAG AWMVPFVVSE AEERLAEILG LPIYGPATSL AHLGSKSGGR MIAEEAGVPM 
ARGFADLRSL TEVEHAARAL SPRSKLMVKL NNSYSGLGNA VVIKDERPLT ACHTSFSAAD 
ENWTTFAEKI AERGAVIEEF IEDRPLHSPS ALARITPGGA YDVVATHEQL LGGPNGDLYQ 
GCAFPARPEY RAQVGECAER IARVLAGRGV VGLFGMDFFA VKTDAGYRAL LCEINLRIGG 
TTHPFGAALL TTGASYDPGT GTLVHGGRSK YYVATDNCTA ACLRGRTPAE VVKLIDDRGL 
GFDREARTGN VLHLLGAVPE YGKLGFTSIG DSAEEAAELH RRTLRALNQS A