Gene RoseRS_3331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3331
Symbol
ID	5210308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	4178384
End bp	4179589
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	59%
IMG OID	640596929
Product	cysteinyl-tRNA synthetase
Protein accession	YP_001277642
Protein GI	148657437
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.552746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.24215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGTTAT TCGACACCCT GCGCGGACAG AAAGCCGAGT TGCTCATCCC GCGCGACCGC 
CCGCTCACGC TCTATGTCTG CGGCGTCACT CCCTACGATA CCACGCACGT TGGTCACGCC 
CATACGTTTC TGATCTTCGA TGTGCTCATC CGCTATATTC GTCACTGCGG CGGTACGGTT 
CGCTACTGTC AGAATACCAC CGACGTCGAT GATCCATTGT TCGAGCGCGC CGCACGTGAT 
GGCATCCCGT GGGACGAACT GGCGCGTCGT GAAACGGAAC AGTTCGTCAA AGACTGTCGC 
GCGCTCAATC TGATCCCTCC CGATTTCTTT CCAAAGGCTT CGGAAGAGAT TGCCGCGATG 
ATCCCGATCA TCGAACGGTT GATCGAATTG GGGCATGCCT ACGTGCGAAA TGGCAATGTC 
TATTACGACG TCTCAACCGA ACCGACCTAT GGCGCAATGG CGCGGGTGAG CGGGTATGAG 
GAACTGCTCG CGCTGGCGAA CGAACGCGGC AACAATCCGA ACGACCCGCT CAAAGACGAT 
CCGCTCGATT TCGTGCTCTG GCAGCGCAGT CGTCCCGGCG AACCGACCTG GCCCAGCCCG 
TGGGGAAGGG GACGCCCCGG ATGGCATATC GAATGCACGG CAATGGCAAC CCGCTACCTC 
GGTCCGCAAC TCGATATCCA TGGCGGCGGG CGTGATCTGA TCTTCCCGCA CCATCCTTCC 
GAAATTGTGC AGACCGAACC GTATACCGGC AAACGCCCCT TTGTTCACTT CTGGGTTCAC 
GGAGGGCTGG CATGGCTTGA TGGTCAGAAG ATGAGCAAGT CGCTCGGAAA TCTGGTGTTT 
ATCAAGGATG CGCTCAGGCA GCACAGCGCC GATGCGCTCC GCTGGTACCT GCTTTCGTTC 
CCCTACCGCG ACGATTTTGA GTATGTGCGC TCCGACGTAC CGCAGGCGGA ACAGAAGGTT 
GGACAACTCA AAGCGGCGCT GGCAGCGCAG GGCGATCCCA GAGGCGAGCG GCTGAACCCC 
GAACCGTTCC GCCAGGCATA CTTCGCCGCG CTCGATGATG ATCTCGATAC GCCGAAGGCG 
CTGGCGCAGA TCAGCGTTCT GAGCGGCGCC ATCCTTGAAG CGGCTTCATC AGGATATGAT 
GTGAGTGATG CCCAATCCGC GCTCCGTGAT ATGGCGAACG TTTTCGGTTT CTGGGCGGCG 
GCGTGA

Protein sequence

MWLFDTLRGQ KAELLIPRDR PLTLYVCGVT PYDTTHVGHA HTFLIFDVLI RYIRHCGGTV 
RYCQNTTDVD DPLFERAARD GIPWDELARR ETEQFVKDCR ALNLIPPDFF PKASEEIAAM 
IPIIERLIEL GHAYVRNGNV YYDVSTEPTY GAMARVSGYE ELLALANERG NNPNDPLKDD 
PLDFVLWQRS RPGEPTWPSP WGRGRPGWHI ECTAMATRYL GPQLDIHGGG RDLIFPHHPS 
EIVQTEPYTG KRPFVHFWVH GGLAWLDGQK MSKSLGNLVF IKDALRQHSA DALRWYLLSF 
PYRDDFEYVR SDVPQAEQKV GQLKAALAAQ GDPRGERLNP EPFRQAYFAA LDDDLDTPKA 
LAQISVLSGA ILEAASSGYD VSDAQSALRD MANVFGFWAA A