Gene Saro_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1939
Symbol
ID	3917162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2053996
End bp	2055561
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	59%
IMG OID	640444685
Product	methionyl-tRNA synthetase
Protein accession	YP_497213
Protein GI	87199956
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0143] Methionyl-tRNA synthetase
TIGRFAM ID	[TIGR00398] methionyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGAAC CCTTCTACAT CACCACTGCC ATCTCCTACC CCAACGGCAA GCCGCATATC 
GGCCATGCCT ACGAGGCAAT TGCCGCCGAT GTTATCGCGC GCTTCCAACG GGCCATGGGA 
CGTGATGTGC GTTTCCAGAC GGGCACGGAC GAACACGGGT TGAAGATGGC GCAGAAGGCC 
CGTGAACTCG GCATAACGCC ACGCGAGCTT TCCGACGAAA TGTCATCTTA TTTCATTAAG 
ATGTGCGACG AACTTAATGT TTCGTACGAC GTTTTCATTC GCACCACCGA GGAGCGGCAT 
CACGCCTCGA CGCAGGAACT CTGGCGTCGC ATGGAGGCCA ATGGTGATCT CTATCTCGAC 
CGCTACGAAG GCTGGTATTC GGTCCGGGAC GAGGCTTTTT ACGATGAGAG CGAACTGGTA 
GCGGGCGAGG GCGGGGAGAA GCTGTCGCCC CAGGGTACCC CGGTGGATTG GACAGTCGAG 
GAAAGCTGGT TCTTCCGGCT TTCGAAATAT GCCGAACCGC TACTGAAGCT CTACGAGGAG 
AATCCCGGGT TCATCCAGCC CGACAGCCGC CGCAATGAAG TGATGCGCTT CGTCGAGGGT 
GGACTGCGTG ACCTTTCGGT TTCTCGCACC AGCTTCGACT GGGGTGTGAA GGTTCCGGGG 
TGCGATGGCC ATGTAATGTA CGTTTGGGTC GATGCTCTCA CCAACTATAT CACTGGGCTC 
GGTTTTCCGG ACGAAAACGG CGACTTTGCA AAGTATTGGC CGGCGAACCT GCACCTGATC 
GGCAAGGATA TCGTCCGCTT CCACACTGTC TACTGGCCGG CCTTCCTGAT GAGCGCGGAC 
ATCGCGCTGC CGCGGCAAGT CTTCGGGCAC GGATTCCTGC TCAACCGTGG CCAGAAGGAA 
TCGAAGTCGC TCGGTAACGT CACCGATCCA CTCGACCTTG CCGACCGGTT CGGGGTAGAT 
CCGCTTCGTT ACTTCCTGAT GCGGGAAGTA GCCTTCGGTC AGGACGGATC CTATTCGGCC 
GAGGCCATTG TGACGCGATG CAATGCAGAG CTAGCAAACA GCTACGGCAA TCTCGTTCAG 
CGCACACTAT CCATGATTTT CAAAAACATG GGCGGCAATC TTGAGACATT TCATAGCAAT 
GTGGGGGACG ACGAACTGCT GGCTACGGTG TTCAATGCGT GCCGTGAGGA ACTGCCGCGC 
GAGTTTTCCG CGCTGAACTT CTCGGCCGGG ATCGAAGCTT GGATGCGTGC GGTCTTTGCC 
TGCAACGCCT ATGTCGACGA ACAGGCGCCG TGGGCGCTGC GCAAGACCGA TCCCGAGCGC 
ATGAAGGCCG TGCTGCTGAC GCTGTTCATA GCGATCCGCG ACCTGACCGT GGCGATTTCA 
CCCGTCGTTC CGGCTGCCGC AGCCAAGGTG CTGGACCAGC TCGGCATTCC AAGGGAAGCG 
CGGGGTTTCG ATGCGTTGAC TGATGCGGAC TGGTACATGG CACGCGTGGC AACCGGAGAG 
AGGCTTGCGC AGCCCATGCC TGCATTCCCC CGCCTTGAAC TGCCGGAGGA GGAAGGATCG 
GCATGA

Protein sequence

MGEPFYITTA ISYPNGKPHI GHAYEAIAAD VIARFQRAMG RDVRFQTGTD EHGLKMAQKA 
RELGITPREL SDEMSSYFIK MCDELNVSYD VFIRTTEERH HASTQELWRR MEANGDLYLD 
RYEGWYSVRD EAFYDESELV AGEGGEKLSP QGTPVDWTVE ESWFFRLSKY AEPLLKLYEE 
NPGFIQPDSR RNEVMRFVEG GLRDLSVSRT SFDWGVKVPG CDGHVMYVWV DALTNYITGL 
GFPDENGDFA KYWPANLHLI GKDIVRFHTV YWPAFLMSAD IALPRQVFGH GFLLNRGQKE 
SKSLGNVTDP LDLADRFGVD PLRYFLMREV AFGQDGSYSA EAIVTRCNAE LANSYGNLVQ 
RTLSMIFKNM GGNLETFHSN VGDDELLATV FNACREELPR EFSALNFSAG IEAWMRAVFA 
CNAYVDEQAP WALRKTDPER MKAVLLTLFI AIRDLTVAIS PVVPAAAAKV LDQLGIPREA 
RGFDALTDAD WYMARVATGE RLAQPMPAFP RLELPEEEGS A