Gene Sros_6102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6102
Symbol
ID	8669400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	6692464
End bp	6693729
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	71%
IMG OID
Product	Histidine--tRNA ligase
Protein accession	YP_003341576
Protein GI	271967380
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.998614
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTGC AGGCGCCGAA GGGCACCTTT GACTGGCTCC CGCCGCGTTC GGAGCAGGCG 
CTCGCCGTGC GGGAGGCGCT GACCGCCCCG GTCCGCCGCG CGGGGTACGG CTACATCGAG 
ACGCCGGTCT TCGAGGACAC CGCGCTGTTC GTCCGCGGTG TCGGCGAGTC GACCGACATC 
GTCTCCAAGG AGATGTACAC CTTCGAGGAC AAGGGCGGGC GCTCGCTCAC GCTGCGCCCC 
GAGGGCACCG CGTCGGTCGT GCGCTCGGTC CTCCAGCACG GCCTGCACAA CGGCCAGCTC 
CCGGTGAAGC TCTGGTACTC CGGCAGCCAG TTCCGCTACG AGCGCGCGCA GAAGGGCCGC 
TACCGCCACT TCTGGCAGAT CGGCGCCGAG GCCCTGGGAG CCGAGGACCC CGCGCTGGAC 
GCCGAGCTGA TCGTGCTGGC CGCCGACGGC TACGCCGGGC TGGGCCTCAC CGGCGTGCGG 
CTGCTGCTCA ACACGCTGGG CGACAAGGAG TGCCGTCCCG GCTACCGGAC GGCGCTGCAG 
GACTTCCTGC GCGCCCTCGA CCTCGACGAG CCCACCCGGC AGCGGATCGA GATCAATCCG 
TTGCGCGTCC TCGACGACAA GCGCCCCGAG GTGCAGGCCC AGCTCGCCGG CGCCCCGCTG 
GTCGTCGACC ACCTGTGCGA GGCCTGCAAG GCCTACCACG AGGAGGTCCG CTCGCTGCTG 
ACCGCCGCCG GCGTGGCCTA CACCGACGAC CCCCGGCTGG TCCGCGGTCT CGACTACTAC 
ACGCGCACCA CCTTCGAGTT CGTCCACGAC GGGCTGGGCT CGCAGTCGGC GGTCGGCGGC 
GGCGGCCGCT ACGACGGGCT GAGCGAGATG CTCGGCGGCC CCGCCCTGCC CAGCGTCGGC 
TGGGCGCTCG GCGTCGACCG GACGCTCCTG GCAATGGAGG CCGAGGGGCT GGCCGGTGCC 
GAGACCGCCG AGTCGCGTGT CCAGGTGTAC GGTGTGCCGC TGGGTGAGGA GGCGCGCCGC 
CGGATGTTCC TGCTCATGAC CGAGCTGCGC CGGGCCGGTC TCGACGCCGA CATGTCGTTC 
GGCGGCAAGG GCGTCAAGGG TGCCATGAAG GGCGCCGACC GGTCGGGTGC GAGCTATGCC 
GTGATCCTCG GCGAGCGAGA TATCGCCGCC GGGTCCGCGC AGGTCAAGGA CCTGGCCAGC 
GGTGACCAGA CCGCCGTACC GCTCGCTGAG ATCGTCACGA CCTTGAAGGA GAGACTGAAG 
AAATGA

Protein sequence

MTLQAPKGTF DWLPPRSEQA LAVREALTAP VRRAGYGYIE TPVFEDTALF VRGVGESTDI 
VSKEMYTFED KGGRSLTLRP EGTASVVRSV LQHGLHNGQL PVKLWYSGSQ FRYERAQKGR 
YRHFWQIGAE ALGAEDPALD AELIVLAADG YAGLGLTGVR LLLNTLGDKE CRPGYRTALQ 
DFLRALDLDE PTRQRIEINP LRVLDDKRPE VQAQLAGAPL VVDHLCEACK AYHEEVRSLL 
TAAGVAYTDD PRLVRGLDYY TRTTFEFVHD GLGSQSAVGG GGRYDGLSEM LGGPALPSVG 
WALGVDRTLL AMEAEGLAGA ETAESRVQVY GVPLGEEARR RMFLLMTELR RAGLDADMSF 
GGKGVKGAMK GADRSGASYA VILGERDIAA GSAQVKDLAS GDQTAVPLAE IVTTLKERLK 
K