Gene Sros_7654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_7654
Symbol
ID	8670975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	8446758
End bp	8447888
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID
Product	cellulose biosynthesis protein CelD
Protein accession	YP_003343070
Protein GI	271968874
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATCA CTGTGGTGCG CCCGCAGGAC CTCGGCGAGG CCGAGTCCCA CCGATGGCGC 
GAGATCCAGA AAGCCTCTCC CAGCCTCGAC AACCCCTTTC TCTCCGTGGA CTTCACCCTG 
GCCATGGGCA GGCTCCGTGA CCACGTCAGG GTCGCGGTGA TCGAGGACGG CGGCGAGATC 
GCGGGATTCC TCCCCCACGA GCGGCACGGC TTCGGCGTCG GCAGGCCGCT GGGCGGCTAC 
CTCACCACCT GCCAGGGGCT GGTCTCGGTC CCCGAGCTGA AGATCGACCC ACGTGACCTG 
CTCCGGGCCT GCGGGCTGTC GGCCATCGAC TTCGACCACC TGGTCGCCGG CCAGCCCACG 
TTCGCGCCCT ACGAGACGGA CGTACGGCCC GCCCCCGTCA TGGACCTCAG CGGCGGTTTC 
GACGCCTACG TCGAGCGGGT GCGCGCCGGC TCGGCGAAGA ACTACAAGAC CGTCCGCTAC 
AAGGAGCGCA AGCTCGGCCG CGAACGGGGC GAGATCCGGT TCGAGTGGGA CTCCGCCGAC 
ATCGGGACGC TGCGCGCGGT CATGGCCTGG AAATCGGACC AGTACCGGCG GACCGGACGG 
GTGGACCGCT TCGCCCAGCC GTGGATCGTG CGGCTCGTCG AGGAGCTGCA CTCCCGGCGC 
TCCGACGACT TCGCCGGCGT GCTCACCATG GTCTACGCCG GAGACACCCC CGTCGCCGGG 
CACTTCGGCC TCCGTACGGC GCACACCCTG GTGGGCTGGT TCCCCGCCTA CGACCCGGCC 
TTCGCCCGCT ACTCCCCCGG GATCATGCAC CACCTGCACA TGGCCGAACA CGCCGCGAAC 
GCGGGGCTGC ACCAGGTGGA CATGGGGAAA GGCGGCCGCG AATACAAGGA ATGGCTTAAA 
ACCGGCGTTT TGATGATCGC CGAGGCACGC ATCTCGCGTC CGTCTCCGGT GGCCGCCGCC 
CAGTGGCTGG GCCGGGTCCC CATCAGCAGA CTCCGCGCCG TCGTAGTGGA CAACCCCTCC 
CTTTTCCGAG CCGCGGACCG GCTACTCAAG GGCTACGGCA GAGCGAGATC CTCTCTCCTG 
TCCCGCCCCA TATCCCCTCC CACCGCAGAA CGATCACCCG AGGCACAGTA A

Protein sequence

MKITVVRPQD LGEAESHRWR EIQKASPSLD NPFLSVDFTL AMGRLRDHVR VAVIEDGGEI 
AGFLPHERHG FGVGRPLGGY LTTCQGLVSV PELKIDPRDL LRACGLSAID FDHLVAGQPT 
FAPYETDVRP APVMDLSGGF DAYVERVRAG SAKNYKTVRY KERKLGRERG EIRFEWDSAD 
IGTLRAVMAW KSDQYRRTGR VDRFAQPWIV RLVEELHSRR SDDFAGVLTM VYAGDTPVAG 
HFGLRTAHTL VGWFPAYDPA FARYSPGIMH HLHMAEHAAN AGLHQVDMGK GGREYKEWLK 
TGVLMIAEAR ISRPSPVAAA QWLGRVPISR LRAVVVDNPS LFRAADRLLK GYGRARSSLL 
SRPISPPTAE RSPEAQ