Gene Sros_3367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3367
Symbol
ID	8666655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3696694
End bp	3698013
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	70%
IMG OID
Product	putative cytosine permease
Protein accession	YP_003339049
Protein GI	271964853
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.130336
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0781791
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGATG AGGACTACCC GCTGGAGCGG GTTCCGCAGG CTGCCCGCTA CTCGTGGTTC 
AACGTGGCCG TGCAGCGCTT CGGCCAGCTG TCGGACCTCA CGCAGTTCCT GCTCGGCGCG 
ACGCTGGGCG CGGGGCTGTC GTTCTGGGGA GCGTTCTGGG CGTTCACGCT CGGCTCGGTG 
ATCCTGGAGA TCGTCTGCAT CTTCGTCGGC ATCGCCGGGA TGCGCGAGGG CCTGTCCACC 
TCCGTGCTGG CCCGCTGGAC CGGGTTCGGC CGGTACGGCT CCACGCTGAT CGGCGTGATC 
ATCACGCTGA GCCTGTTCGG CTGGTTCGGC GTGCAGACCG CGGTCTTCGC GGCGGGCCTG 
CACGCCATCA TGAGCGGCAT CCCCCTGTGG GCCTGGTCCC TCATCGCCGG CCTCGGCGTG 
ACCGCCCTGG TCCTGAAGGG CTTCCGGGCG ATGGGCTGGA CGGCCTTCGT CACCGTGCCC 
GCGTTCCTGG GGCTGGCGGG CTGGGCCATG TGGGTGGAGG TCTCCCGGCA CAGCCTGGGC 
GAGCTGATCT CCTCCTCCCC CTTCGGCGCC CCGATCACGG TCGCGACCGG GGCGACGATC 
GTCGCCGGTT CCTACATCGT CGGCGCGGTC ACCACCCCGG ACATGACCCG GTTCAACCGC 
AGCACCTCCG ACGTGGTCAA GCAGACGCTG GTCGGCATCT CCCTCGGCGA GTACGTGCTC 
GGCCTGGCCG GGGTGCTCCT GGCCTACGCC GTCAAGACCT CCGACATCGT CGCGATCATC 
ACGGCCTCCT CCGGAGTCGT CGGCGTCGTC ATCCTGGTCT CGGCCACCGT GAAGATCAAC 
AACTGGAACC TCTACTCGGC GGCGCTCGGA CTGATGAACG CCGTGGAGTC CACGGTCGGC 
GTACGGCTCA ACCGGGTCGC CGTCACCGTC GGCATCGGCC TGCTGGGCAG CATCGCCGCC 
GCCGCCGGGA TCCTGGACGC CTTCGCCGGA TTCCTGTTCG TCCTCGGCGT CGTCACCCCG 
CCGATCGCCG GGATCATGGT CGCCGAGTAC TTCGTGGTCA AGCGCTGGCG GCCCGTCCTG 
GACGCCTCCC GCGAGCTCGG GCGGCTGCCC GAGACCGAGC CCGCCTGGGT GCCCGCCACC 
ATCGCGATCT GGGCGGCCGC GGCCCTGGTC GGCTGGCTGA GCGACGCCTA CGGGTGGATC 
GGCATCCCCG CGCTCAACTC GCTGATCCTG GCCGGGCTCG GCTACATCGT CGCCGGGAAG 
CTCGGCCTGG TCCGCGGGAC GCGGGAACTC CCCGTCGACC AGCCTGCCGT ACACGTCTGA

Protein sequence

MIDEDYPLER VPQAARYSWF NVAVQRFGQL SDLTQFLLGA TLGAGLSFWG AFWAFTLGSV 
ILEIVCIFVG IAGMREGLST SVLARWTGFG RYGSTLIGVI ITLSLFGWFG VQTAVFAAGL 
HAIMSGIPLW AWSLIAGLGV TALVLKGFRA MGWTAFVTVP AFLGLAGWAM WVEVSRHSLG 
ELISSSPFGA PITVATGATI VAGSYIVGAV TTPDMTRFNR STSDVVKQTL VGISLGEYVL 
GLAGVLLAYA VKTSDIVAII TASSGVVGVV ILVSATVKIN NWNLYSAALG LMNAVESTVG 
VRLNRVAVTV GIGLLGSIAA AAGILDAFAG FLFVLGVVTP PIAGIMVAEY FVVKRWRPVL 
DASRELGRLP ETEPAWVPAT IAIWAAAALV GWLSDAYGWI GIPALNSLIL AGLGYIVAGK 
LGLVRGTREL PVDQPAVHV