Gene Elen_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_0153
Symbol
ID	8414437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	213736
End bp	214953
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	61%
IMG OID	645023133
Product	arginine deiminase
Protein accession	YP_003180536
Protein GI	257789930
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGGAG TAAACGTCAA GAGCGAGATC AAGCCCTTGA AGAAAGTCCT GCTGCACCGC 
CCGGGTAAAG AGCTTCTGAA CCTGACGCCG AACACGCTCG AGGAGCTGCT GTTCGACGAC 
ATCCCGTTCT TGAAGGTCGC CCAGGAGGAG CATGACGCGT TCGCACAGGC TCTGCGCGAC 
AACGGCGTCG AAGTGTTTTA CCTGGAAGAC CTCATGGCTG AGGTTCTCGA GGCCAACCCC 
GAGCTGCGCG AGCAGTTCCT CAAGCAGTGG ATCGAAGAGG CCGGCATCCG CACGGATCGC 
TACCAGAAGA TCATCTTCGA CTACATGCAG GAGAACTACC CCGACGCCAA GGACTTCGTG 
CTGAAGACGA TGGAGGGCAT CAACCTCACC GAGCTGCACA CCGACAAGTC CAACTCGCTG 
GTGGACCTGG TTTCCGAGTC CTCCAAGATG GTCGTGGCCC CCATGCCGAA CCTGTACTTC 
ACCCGCGACC CGTTCGCGAT GATCGGCAAC GGCGTGTCCA TCAACCGCAT GTACTCCGAG 
ACCCGCAACC GCGAGACCAT CTACGGCGAG TACATCTTCA CGCACCATCC CCTGCTCAAG 
GGCACCCCTG AGTACTACAG CCGCTACAAC ACGTTCCACA TCGAGGGCGG CGACATCCTC 
AACATCAACG ACAAGGTGCT GGCCATCGGC ATTTCCCAGC GCACCGAGCC CGATGCCATC 
GACGCCATCG CGAAGAACAT CTTCAACGAT CCGACGAGCC CCATCGAGAC CATCCTGGCG 
TTCAACATCC CGAACTCCCG CGCCTTCATG CACCTCGACA CCGTGTTCAC CCAGATCGAC 
GTTGACAAGT TCACCATCCA CCCGGGCATC ATGGGCCCGC TGACCGTGTT CGAGATCACC 
GCCGAAGGCG ACGGCATCAA GGTCAAGGAA GTGAACGGCA CGCTGGAGAG CATCCTGGAG 
ACCTACATGG GTCATCCCGT GGAGCTCATC CCCTGCGGCG GCGGCGACCG TATCGCGGCC 
GAGCGCGAGC AGTGGAACGA CGGCTCGAAC ACGCTGTGCA TCGCTCCGGG CACCATCGTG 
GTGTACGAGC GCAACGACGT GACGAACGCC GTGCTCGAAG GCAAGGGCCT CAAGCTGATC 
GTGGTCCCGT CTGCCGAGCT GTCCCGTGGC CGTGGCGGCC CGCGCTGCAT GAGCATGCCC 
ATCGAGCGCG AAGACTAA

Protein sequence

MSGVNVKSEI KPLKKVLLHR PGKELLNLTP NTLEELLFDD IPFLKVAQEE HDAFAQALRD 
NGVEVFYLED LMAEVLEANP ELREQFLKQW IEEAGIRTDR YQKIIFDYMQ ENYPDAKDFV 
LKTMEGINLT ELHTDKSNSL VDLVSESSKM VVAPMPNLYF TRDPFAMIGN GVSINRMYSE 
TRNRETIYGE YIFTHHPLLK GTPEYYSRYN TFHIEGGDIL NINDKVLAIG ISQRTEPDAI 
DAIAKNIFND PTSPIETILA FNIPNSRAFM HLDTVFTQID VDKFTIHPGI MGPLTVFEIT 
AEGDGIKVKE VNGTLESILE TYMGHPVELI PCGGGDRIAA EREQWNDGSN TLCIAPGTIV 
VYERNDVTNA VLEGKGLKLI VVPSAELSRG RGGPRCMSMP IERED