Gene Sros_5901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5901
Symbol
ID	8669195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6469262
End bp	6470797
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	70%
IMG OID
Product	FHA domain-containing protein
Protein accession	YP_003341379
Protein GI	271967183
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0502803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.176709
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCACCCC CCCACACGCC GGTCTCGGCC GGTGATCTCA CTCCGGAGCT GCTCGGCACG 
CCCGAATGGA GCGATCAGCT GGTCGCAGCC GCCGGCATTC CCATGTACGA CATTCCGTTC 
CTGACGGTCG GCGGTGGCAT GGGCTCCTTC GTGACCCTGG ACTACCTGCG GATCTACGGC 
GTGCCCGCCT CCCAGATGCG GGTGGTGTCC AACATCGACA CCCCGTGGCA GACCTACGAG 
TTCCTGACCA GGTGCTCGCA GATCCCCCGC TCCGAGCGGA TCCGCTCCGA CTCCGCCTCG 
CGGCCCGACA ACATCTGGGG GTTCCCCTCC TATGCGCTGC AGGAGACCTG GACGGACAAG 
ACGCCGGCCT ACCTGTGGCA GCTGCTGACC GAGCCGCTCC TGAACGACTA CTGGACGCCG 
CGCGCCGGCA CGGTCTTCCA GAGCCTGGAG CGCGAGGCCA AGCGCATCGA CTACTGGGAC 
ATGCTGGTCA AGGGCCAGGT CCGGATGGTC CGCCGGCGGG CCGGCGGCGG CTACTTCACC 
GTGGTCACCC CGCCCGAGGG CTCGGCGCCC ACCAAGCGCA TCATCTTCCG CTCGCGCTTC 
GTGCACATCG CGATCGGCTA CCCCGGCCTG AAGTTCCTGC CCGACCTGCA GGAGTTCCGT 
ACCAAGCACG GCGACTACCA GCACGTGGTG AACGCCTACG AGCCGCACGA GCAGGTCTAC 
GAGTTCCTCA AGACCCGTCC CGGCACGGTG GTCATCCGGG GCGGCGGCGT CGTGGCCTCC 
CGCGTGCTGC AGCGCCTGTT CGACGACCGG GAGAAGTTCC GGCTGCAGAC CCAGATCGTC 
CACATCTTCC GGACCTTCGT CACCGGCTCC CACGGCCCGC ACGTCTGGGC GCGGCGCAAG 
GGCGGCGACG GCTGGGCCTA CCAGGGCTTC AACTATCCCA AGTCGGTGTG GGGAGGCCAG 
CTCAAGGCGC AGATGCGCCG GCTGGAGGGC GCCGAGCGGG CCGCGAAGTA CAAGGAGATG 
GGCGGCACCA ACACCCCCTA CCGCCGGCGC TGGCAGGAGC AGATGCGGGC GGGCCGCAGC 
GGCGGCTACT ACCACCCCGT GCAGGGCACC GTGGACCGGG TGGAGCGCGG CCCCGACGGC 
CGGCTGGTCA GCTACGTGCG CAGCAGCGAC GGCATCGTCC GCGAGCCGGT GGCCGACTAC 
ATCATCGACT GCACCGGCCT TGAGGCCGAC ATCGCCGAGC ACCGGATCTA CGAGGACCTG 
CTCCGGCACG GCGGGGCCTA CCGCAACCCG GTCGGCCGGC TGGAGGTGGA GCGCCACTTC 
GAGGTGAAGG GGACGGCCAG CGGCGACGGC GTCCTCTACG CCTCCGGCTC GGCGACGCTC 
GGCGGTTACT TCCCCGGCGT CGACACCTTC CTCGGCCTGC AGATCGCGGC CCAGGAGATC 
GCCGACGACC TGGCACGGCG GGGGTTCGTC CGCAGGATGG GGCCGCTCCG GTCGACCTCG 
CAGTGGTTCA AATGGGCCTT CAACTCGCCG GTGTAA

Protein sequence

MAPPHTPVSA GDLTPELLGT PEWSDQLVAA AGIPMYDIPF LTVGGGMGSF VTLDYLRIYG 
VPASQMRVVS NIDTPWQTYE FLTRCSQIPR SERIRSDSAS RPDNIWGFPS YALQETWTDK 
TPAYLWQLLT EPLLNDYWTP RAGTVFQSLE REAKRIDYWD MLVKGQVRMV RRRAGGGYFT 
VVTPPEGSAP TKRIIFRSRF VHIAIGYPGL KFLPDLQEFR TKHGDYQHVV NAYEPHEQVY 
EFLKTRPGTV VIRGGGVVAS RVLQRLFDDR EKFRLQTQIV HIFRTFVTGS HGPHVWARRK 
GGDGWAYQGF NYPKSVWGGQ LKAQMRRLEG AERAAKYKEM GGTNTPYRRR WQEQMRAGRS 
GGYYHPVQGT VDRVERGPDG RLVSYVRSSD GIVREPVADY IIDCTGLEAD IAEHRIYEDL 
LRHGGAYRNP VGRLEVERHF EVKGTASGDG VLYASGSATL GGYFPGVDTF LGLQIAAQEI 
ADDLARRGFV RRMGPLRSTS QWFKWAFNSP V