Gene Elen_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_1514
Symbol
ID	8415812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	-
Start bp	1805016
End bp	1806395
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	65%
IMG OID	645024482
Product	transposase IS204/IS1001/IS1096/IS1165 family protein
Protein accession	YP_003181871
Protein GI	257791265
COG category	[L] Replication, recombination and repair
COG ID	[COG3464] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.623533
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCGG CGGGCTACGT CGAGGAGCTG CTCGGCGTCC GGGGCTGCGA GCTCATCGGC 
AGTGCGACCA AGGTCGATTG CGGCAGGAGG CTCCAGCAGT TCGACCTGAG ATACCGCGGG 
CCCGTCCCCG CATCGTGCCC CGAGTGCGGC GGGACGCTGC ACAGCCACGG CGCGAGGACC 
GTCGGCGTTG TGTCGACGCC ACACTTGGGC ATCCCGACGA GGCTCGAGAT AGGGTTCCCG 
CGGATGCGAT GCCCGGAGTG CGGCTACGTG TGGCGCCCGG CGATAGGCGG GGTCGACGCG 
GGTCACCGAA TGACGGAGGC GGCATACGCC GACATCGCCC AGCGCTCACT CAGGCTCACC 
TTCCGCGAGG TCGCCGAGGA GTACCCGCTC TCGCACGTCA CCGTGAAGAA CGTCTTCGAG 
GACTACGTCC GCGAGAACGC CTCGAGGCTT CGCTTCAAGG TGCCGGCGTT CCTGGGCATA 
GACGAGAAGA ACCTCAAGAG GGTCGGCATG GTGACCGTGA TCACCGACCT CGAGCACAGG 
ACGGTCTTCG ACATGGTGCC CGGCAGGACG CAGTCCGACC TCGACGCCTA TTTCTCCTCG 
TTGGAGGGCC TCGAGCGCGT ACGATGGGTC TCGAGCGACA TGTACCGGCC GTTCTGGAGG 
AGCATAGCCA AGTACACCCC GAACGCGACA TGGGTCATCG ACCACTTCCA TGTCGTGAGG 
GGAGCCAACG AGGCCTTAGA CGCGGTCCGC AAGGGCCTCC AGGGAGCCCT CGACAGGAAG 
GGCCGCCTTG AGCTAAAGAA GGGCCTCGCC TACGCCCTCA GGAAGCGGAC ACGCGACCTC 
AGCCCCTACG AGGCGTCGGC CCTAAGGGCG CTACGGGAAG ACCCCTCCTA CTCGACGCTG 
ATGACCGCGT ACGACCTCAA GGAGGACTTC TTCGGCATTT ACGACGACCA TCCGTCCTCA 
CGCGAGGAGG CTGAGGCGGC GTTCGACGCC TGGATTCGGG AAATTCCCGA TGGCAGGGAG 
TTCGATCCGT TCAGAGCCCT TGCTCGGACC GTCCAGAACC ACCGCGAGTT CATCTTCAAC 
TACTGGGAAT GCCCCAGCCG CATCTCGAAC GGCTACACCG AGTGCGCGAA CCGGCTCATC 
AACGAAACGG ACATGAGAGG GCGCGGATAC TCGTTCGAGA CGCTTCGGGC AAGGACCCTC 
TACCGCAGGC AGAACCTCGA CCGCATCATC GCGAGCAACG GGCTCACGAT CGGCCCTCGC 
ATCGATGCTC CCGGCCCGCT CTTCGTGACC GAGCCCGACC GCGAGGACGA GGCCGTGGAC 
GAGTTCATAG ACCCGAGGTC GGGAGTGAAG GTCGACGCAA CGACTGGGGA GGTCCATTAA

Protein sequence

MGAAGYVEEL LGVRGCELIG SATKVDCGRR LQQFDLRYRG PVPASCPECG GTLHSHGART 
VGVVSTPHLG IPTRLEIGFP RMRCPECGYV WRPAIGGVDA GHRMTEAAYA DIAQRSLRLT 
FREVAEEYPL SHVTVKNVFE DYVRENASRL RFKVPAFLGI DEKNLKRVGM VTVITDLEHR 
TVFDMVPGRT QSDLDAYFSS LEGLERVRWV SSDMYRPFWR SIAKYTPNAT WVIDHFHVVR 
GANEALDAVR KGLQGALDRK GRLELKKGLA YALRKRTRDL SPYEASALRA LREDPSYSTL 
MTAYDLKEDF FGIYDDHPSS REEAEAAFDA WIREIPDGRE FDPFRALART VQNHREFIFN 
YWECPSRISN GYTECANRLI NETDMRGRGY SFETLRARTL YRRQNLDRII ASNGLTIGPR 
IDAPGPLFVT EPDREDEAVD EFIDPRSGVK VDATTGEVH