Gene Elen_3060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Elen_3060
Symbol
ID	8417395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Eggerthella lenta DSM 2243
Kingdom	Bacteria
Replicon accession	NC_013204
Strand	+
Start bp	3557579
End bp	3558961
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	62%
IMG OID	645026040
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	YP_003183392
Protein GI	257792786
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCCTG AAAACGACAT CGATTACTCG CTGTCGCGCG TTCCTGATGA AGCGAAACAG 
CCATTTTGGC GGATTCTTTT CATCAGGATC GGCGCGATCT GCTGCGTATC CCAGCTCATG 
TTGGGCGCGG CACTAGGCTA CGGCCTGACG TTCTGGGATG CCTTCCTGGC AACCATGCTC 
GGCTCGGTGC TGCTTCAGGT GGTCAGCTGG GCGCTGGGCA CGGCGGCCGC GCGCGAAGGC 
TTGTCCACCA GCCTGCTGTC CCGCTGGACC GGGTTCGGCA AGGTAGGATC CGCCCTGTTC 
GGCGGCGTGG TGGCTATCTC CATGGTGGGC TGGTTCGGCG TGCAGAACGC GGTGTTTGGC 
CAGGGCATGG CTGAAATCGT CCCGTTCACA GATTTCCTCG GCACGCAGGA GATCCTGCCC 
GGCATCATGG CTGGAATCAC GCCCGAGTAC ATCTTCTGGG CCATCATCAC CGGCCTGGGC 
ATCACGCTGC TCGTGGTGTT CGGCATCAAG GCCATCGCGA ACTTCGCCAC GGTGTTCGTG 
CCGCTGTTCG TGATCGTGGT CATCGTAGCC GCAGCCATCA TCCTGCAGAA CCATTCGCTG 
ACCGAGCTTC TCACCACGGC CCCTCCGGGA CCGGCGCTGT CGCTGGGCGC GGCAACCACC 
ATGGTGGCGG GCGGCTTCAT TGCGGGCGCC ATCTGCACGC CCGACTACGC GCGATTCCTG 
AAGAACGGCA CCCAAGCATT CTGGATGACG CTCATCGGCA CGTTCGTGGG CGAGCTGGGC 
ATGAACCTGC TTGCCGTGCT GCTGGCGCAC GCCATGGGCA CCGAGAATAT CGTCGACATC 
ATGATGGGCA CGTCGGGCAT CATCGGCGTC ATCATCGTAG TCGCCTCCAC GGTGAAGCTG 
AACGACATCA ACCTGTACTC GTCCAGCCTG GGCTTGGCAA CCATGATCAA CGCGCTGTTC 
AACAAGGCCA TCAGCCGCAA CGGACTCGTG TGGGCGCTCG GCATCGTGGG CACGCTGCTG 
TCGGTCATCG GCATCATCAA CTACTTCACT AACTTCCTCA CGCTGCTGGG CGTGGCCATC 
CCGCCCGTCG CCGGCATCAT GGTGGTGGAC TACTTCATCT TGAAGCGCAG CCGCGCGACG 
CTTGACGCTT CGCGCGCCAA GGGCGAGCTG CCCGAGAAGG TTGAGAAGTG GAACCCCATC 
GCCATCGTCT GCTGGATCGC CGGTTTCGCC GTGGGCGAGG TCACCAGCAT CATGAACGCG 
GGCATTCCGG GCCTGAACTC GCTGATCCTG GCCGGCGTGC TGTACTGGAT CGTGATGAAG 
GTGTACGCCT CCATGAAGAA GGTGGACACC GTTACGTTCA CGGAAACGGA CCAAGTGCTG 
TAA

Protein sequence

MAPENDIDYS LSRVPDEAKQ PFWRILFIRI GAICCVSQLM LGAALGYGLT FWDAFLATML 
GSVLLQVVSW ALGTAAAREG LSTSLLSRWT GFGKVGSALF GGVVAISMVG WFGVQNAVFG 
QGMAEIVPFT DFLGTQEILP GIMAGITPEY IFWAIITGLG ITLLVVFGIK AIANFATVFV 
PLFVIVVIVA AAIILQNHSL TELLTTAPPG PALSLGAATT MVAGGFIAGA ICTPDYARFL 
KNGTQAFWMT LIGTFVGELG MNLLAVLLAH AMGTENIVDI MMGTSGIIGV IIVVASTVKL 
NDINLYSSSL GLATMINALF NKAISRNGLV WALGIVGTLL SVIGIINYFT NFLTLLGVAI 
PPVAGIMVVD YFILKRSRAT LDASRAKGEL PEKVEKWNPI AIVCWIAGFA VGEVTSIMNA 
GIPGLNSLIL AGVLYWIVMK VYASMKKVDT VTFTETDQVL