Gene Gura_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3641
Symbol
ID	5164254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	4270136
End bp	4271260
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	59%
IMG OID	640551125
Product	leucyl aminopeptidase (aminopeptidase T)-like protein
Protein accession	YP_001232367
Protein GI	148265661
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000266351
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACAGCA AAGCCTTCTC GGATCTTTTC AGCATCAACA TGGGGGTAAA AAGCGGGGAG 
CGCATCCTGG TCTTCAGCGA TACGATCCGC CCCGACGAAA CGCCATCTGC GGCTGATGCG 
GACCGCCGCG CCAGGCTGTT GCAGACCGCT GCTGATGCGG CTGCCTATGC CGGGAAGATA 
TACGGCAACA CCACTTTCAT CTCGTTCCCC GCCACCACCG CCTCCGGCGC TGAACCGCCG 
GAAGCTCTCT GGCGAGCAGC CTTGGGTGAC AGTGCTGCCG ACAAGCTCGT GGAGGCTGGC 
ATCCTGCCAC GGCTTCTATC CAAGGAGGCC ACCCCGGAAG AAGTCGAACG AGCCAGAGAA 
ATCGTCATTA TGGGAAAAGG AGCCGTTGCC GATGTGGTAA TTGCTCTCGC CAACAATTCC 
ACCAGCCACA CACGCTTCCG CTCCCTGATA AACGCCGCCG GCGGACGCTT CGCCAGCCTT 
CCCCACTTCG ACCCAGCGAT GTTTTTCACC TCCATGCAAG TCGACTGGCA GGCCCTTGTC 
GAACGAACCG CCAAGCTCGC CGGAGAAATA AACGGTGCCG TGGAAATCGA AGTGACCACC 
CCCAACGGCA GCCGGATGCG TATCGGCAAG CAGGGAAGGA TTGCCGAAGG GGACGACGGC 
CTTTTAACCG CGCCGGGTAG CTTTGGCAAC CTGCCGGCCG GCGAAGTCTA TCTGGCGCCG 
CTGGAAGGAA CATGTGAAGG AATAATGGTT CTGGAGTATG CGCCAAACCG CAAACTCGTC 
TCGCCGATTG AGCTTGTAGT TAAGAACGGG ATTGTCACCG AGATTCGCGG CGATGAACCG 
TACAGACATA AACTGGAGCA GAAATTCGCT GAGAGCGCAA AAAATCGGAA TATCGCCGAG 
CTGGGAATCG GCACCAACGA CAAGGCGAGC AGGCCGGACA ACATCCTCGA AGCGGAAAAA 
ATTCTCGGCA CCATCCATAT TGCCCTGGGG GACAATTCCG GCTTCGGCGG CACCGTCAGC 
ACCCCGTTCC ACGAGGACTA CGTGTTTTAC GAGCCGACGC TGACCGCCAT CATGGCCGAC 
GGGACGGAGA AAATCCTGCT GCGCCAAGGG CAACTTACTA TCTGA

Protein sequence

MYSKAFSDLF SINMGVKSGE RILVFSDTIR PDETPSAADA DRRARLLQTA ADAAAYAGKI 
YGNTTFISFP ATTASGAEPP EALWRAALGD SAADKLVEAG ILPRLLSKEA TPEEVERARE 
IVIMGKGAVA DVVIALANNS TSHTRFRSLI NAAGGRFASL PHFDPAMFFT SMQVDWQALV 
ERTAKLAGEI NGAVEIEVTT PNGSRMRIGK QGRIAEGDDG LLTAPGSFGN LPAGEVYLAP 
LEGTCEGIMV LEYAPNRKLV SPIELVVKNG IVTEIRGDEP YRHKLEQKFA ESAKNRNIAE 
LGIGTNDKAS RPDNILEAEK ILGTIHIALG DNSGFGGTVS TPFHEDYVFY EPTLTAIMAD 
GTEKILLRQG QLTI