Gene Sros_1418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_1418
Symbol
ID	8664693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	1479934
End bp	1481115
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	74%
IMG OID
Product	hypothetical protein
Protein accession	YP_003337155
Protein GI	271962959
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0272314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTCA CACTCTCCGC CGACGAGGCC CGCCGGATCA TCCTCCGCGC CCAGGGCCTC 
CTCGGCGCCG ACGCCCGCCG CGGCGGCGCC CCCGCGACCC TGCGCCGCCT GGGAGCCGTC 
CAGCTCGACA CGATCTCCGT CCTCGCCCGC TCCCACGAGC TCGTCGCCTA CGCCCGTCTC 
GGCGCCGTCG GCAGGCAGCG GATCGAGCGC GCCTACTGGG ACGACCCGGC GCAGGCCTTC 
GAATACTGGT GCCACGCCGC CTGCGTCCTG CCGATCGACG ACTGGTCCCT CTACGCCTTC 
CGGCGCAGGT ATCTCCGCGC CAGGAAATAC CGCTGGCACG AGGTTCCCGG CAACGTGGAC 
AAGGTGCTCG AGCAGGTGCG CGAGAGCGGC CCGATCACCA CCGCCGACAT CGGGGGCGCC 
AAGAACGGCG GCCTGTGGTG GGACTGGTCC GACTCGAAGA TCGCCATCGA GTGGCTGCTG 
GACATCGGCG AGGTCGTCTG CACCCGCCGC GTCGGCTGGC GCCGCGTCTA CGACCTGACC 
GAACGCGCGG TCCCCGCCCA CCTCCTGGCC GAGGACCTCT CCGACGCCGA GTGCATCACC 
CGCCTGGCGG GGATCGCCGG CCGCGCCCTC GGCGTGGCCA CCCGGGCCGA CCTCGTCGAC 
TTCCTCCGCC TCAGGCCCGC CTATGCCGCC CTCCTGGACG CCTCGCTGCT CGACGGCAGC 
GCCGGCCTCA CCCCGGTCCA GGTCTCCGGC TGGCCCGACC GCTCGGCGAG CGCGTGGGCC 
GATCCGGCCG CCCTGGAGGG CGAGCCGCGG GGCCGCCACC GCACGACCCT GCTGTCGCCG 
TTCGACTCCC TCGTCTGGGA CCGCGCCCGG ACCGCCCGCG TCTTCGGCTT CAGCCACCGG 
CTTGAGGCCT ACGTCCCCAA GGAGAAGCGC GTCCACGGCT ACTTCACGAT GCCCGTCCTC 
GCCGGGGGCC GGCTGATAGG CCGGGTCGAC CCCGCCCGCG AGGGCTCCAC GCTGGTCGGC 
CGCCAGGTCA GCCTCGAACC CGGCGTCAAC CAGCGCAAGG GCGCCGAGTC CCTGGCCGAC 
GCGCTGTGGG AGGCCGCGAG CTGGGTCGGC TGCGACGACG TCCGCGTCGA CCGCGTCGAC 
CCGCACCTGT CCGCGCCCCT GCGGCACGCC CTGGCCCGCT GA

Protein sequence

MTVTLSADEA RRIILRAQGL LGADARRGGA PATLRRLGAV QLDTISVLAR SHELVAYARL 
GAVGRQRIER AYWDDPAQAF EYWCHAACVL PIDDWSLYAF RRRYLRARKY RWHEVPGNVD 
KVLEQVRESG PITTADIGGA KNGGLWWDWS DSKIAIEWLL DIGEVVCTRR VGWRRVYDLT 
ERAVPAHLLA EDLSDAECIT RLAGIAGRAL GVATRADLVD FLRLRPAYAA LLDASLLDGS 
AGLTPVQVSG WPDRSASAWA DPAALEGEPR GRHRTTLLSP FDSLVWDRAR TARVFGFSHR 
LEAYVPKEKR VHGYFTMPVL AGGRLIGRVD PAREGSTLVG RQVSLEPGVN QRKGAESLAD 
ALWEAASWVG CDDVRVDRVD PHLSAPLRHA LAR