Gene Elen_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1944
Symbol
ID	8416251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	2279719
End bp	2281446
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	66%
IMG OID	645024917
Product	arginyl-tRNA synthetase
Protein accession	YP_003182297
Protein GI	257791691
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.567724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.240014
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAATTC GCGAACAACT TGAACAGCTG ATCGACGCGG CCGTCGCGGC CGCGTGCGAG 
GACGGAACGC TCACGCTCGA GCAGGCTCCC GAGGCGGCTC TCGAGCGCCC GCGCGACGAG 
AGCAACGGCG ACTGGGCGTC CACCGTCGCC ATGCGTTCGG CAAAGCTTGC CAAGAAGAAT 
CCTCGCGAGA TCGCTCAGAT CATCGTCGAC CACCTGCCCG AGAACGACAT GATCGCTTCC 
GTCGACATCG CCGGCCCCGG CTTCATCAAC ATTCGTCTGG CGAACGCCGT CCTGCAGGGC 
GTTGTGGCGG CGGCTCGCGC CGAGAAGGAC GACTTCGGCA AGGGCGAGAT TCCCGAGGGC 
GAGCGCAAGA TCAACCTGGA GTACATCTCG GCGAACCCCA CCGGCCCCTT GCACGTGGGC 
CATGGCCGCT GGGCCGCGCT GGGCGATGCC ACGGCGCGCG TCATGCGCCA TGCGGGCTAC 
GACGTGTTCG AAGAGTTCTA CATCAACGAT GCCGGCACGC AGATGGACAA CTTCGGCGAG 
TCGGTGGCCG TGCGCTACCA GCAGCTGCTG GGCCGCGACG TGGAGATGCC CGAGGCGTGC 
TATGCAGGCT CTTACGTGAA GGATATCGCG CAGACCATCA TCGATGAGGA CGGCGACAAG 
TGGCTCGATG CCGACCCGAA GGAGCGCATG GAGAACTTCC GCGAGCGCGC CTATGCCTAC 
GAGTTGGCCG AGCAGCACCG CGTCACCGAG CGGTTCGGCA CCACCTTCGG ATGCTGGTTC 
TCCGAGCGCT CGCTGTACGT GCCCGATGAG GACGGCTTGA GCGCGGTGGA CCGCAGCCTC 
AAGGCCATGG ACGAGAAGGG CTACATCTAC GTCGAGGACG GCGCCACCTG GTTCAGGTCC 
AGCGCGTTCG ACGACGAGAA GGATCGCGTG CTCATCAAGG CCAACGGCGA GATGACGTAC 
TTCATGAGCG ACGTGGCGTA CCACTACAAC AAGATGGAGC GCGGCTTCGA CCACCTCATC 
AACATCTGGG GCGCCGACCA CCACGGCTAC ATCGCCCGCT GCGAGGCCAT GCTGGCCGCG 
TGGGGCTGGC CCGGCGCGCT CGAGATCATG CTCGGCCAGC TGGTGAACCT GTTCCGCGAC 
GGCGAGGCCG TGCGCATGTC GAAGCGCACG GGCGAGATGA TCACGTTCGA GGAGCTCATC 
GACGAGGTGG GCGTGGACGC CACCCGCTAC CTCATGCTGG CGAAGTCCTC CGACCAGCCC 
ATCGACTTCG ACATCGAGGT GGCGAAGAAG AAGGACGCGT CGAACCCGGT GTACTACGTG 
CAGTACGCGC ACGCGCGCAT CTGCTCGATC CTGCGCAAGG CGGCCGACCC GGCCGATGCC 
GAAGCGGCCG CGAACGGCGA CATGTCGATG GACGAGCTGG CCTCGAAGGT GATCCCGGCG 
AACGTGGACC TCTCGCCGCT CACGCACGAG TCCGAGCTGG CGCTGATGCG CAAGATGGAC 
GACTTCGGCC CGCTCGTGGC TCAGGCGGCT CGCGACCGCG CGGCGTTCCG TTTGACGCAC 
TACGCTCAGG ATCTGGCCTC GCTGTTCCAT TCGTTCTACA CGAACTGCCA CGTCATCGGC 
GAGGAGGAGG CTGTGACGAA CGCGCGTCTT GCCCTCGTGG ACGCCACGCG CATCGTGCTG 
GCCAAGACGC TGGACCTGCT GGGCGTTTCC GCTCCGGCCA AGATGTAG

Protein sequence

MQIREQLEQL IDAAVAAACE DGTLTLEQAP EAALERPRDE SNGDWASTVA MRSAKLAKKN 
PREIAQIIVD HLPENDMIAS VDIAGPGFIN IRLANAVLQG VVAAARAEKD DFGKGEIPEG 
ERKINLEYIS ANPTGPLHVG HGRWAALGDA TARVMRHAGY DVFEEFYIND AGTQMDNFGE 
SVAVRYQQLL GRDVEMPEAC YAGSYVKDIA QTIIDEDGDK WLDADPKERM ENFRERAYAY 
ELAEQHRVTE RFGTTFGCWF SERSLYVPDE DGLSAVDRSL KAMDEKGYIY VEDGATWFRS 
SAFDDEKDRV LIKANGEMTY FMSDVAYHYN KMERGFDHLI NIWGADHHGY IARCEAMLAA 
WGWPGALEIM LGQLVNLFRD GEAVRMSKRT GEMITFEELI DEVGVDATRY LMLAKSSDQP 
IDFDIEVAKK KDASNPVYYV QYAHARICSI LRKAADPADA EAAANGDMSM DELASKVIPA 
NVDLSPLTHE SELALMRKMD DFGPLVAQAA RDRAAFRLTH YAQDLASLFH SFYTNCHVIG 
EEEAVTNARL ALVDATRIVL AKTLDLLGVS APAKM