Gene GM21_2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2015
Symbol
ID	8137349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2337474
End bp	2338538
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	63%
IMG OID	644869628
Product	protein of unknown function UPF0118
Protein accession	YP_003021825
Protein GI	253700636
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.00000000000281213
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATAAAA AACTCTACCT AAGCCTCATC GCTGCCTTTT TCACCGTTGC AGCGATAGCG 
GCGATAGTCC TCTTTGCCGC TCCCATATTG AAGCCGCTGG CCTGGGCTCT CATCATCGGC 
ATCGCCACCA TGCCGCATTA CCAGCGCATC CTGAACCGCT TCCCCGATCG GCCGGGGCGC 
GCCTCGGGCC TCATGCTGCT CGCCGTGGCC GTCTGCCTGG TGCTGCCGGC GTCGTGGCTG 
GTGATCACCG CAGCCGTCAA CGCTCCTGAG TGGTACCGGC AACTGGAGCA GATGATCCAG 
GAGGTCACCA GGACCAGTTC CGGCGCCCTC AGCCAGATTC CCTACTACGA CCGGATTATG 
TCCCTCGTGG AGCGCTTCGG CATCGATCTG GGCAATATCG GCGGCAAGAT CGCCTCCAGC 
GGCTCGACCG TGATACTGAA CGCCGCGACC AACATGGTGC GCAACCTGTT CGACTTCATC 
TTCACGCTGC TGGTGGCCCT GTTCCTGCTC TTTTTCATCT ACCGCGACGG CGAGCGGGCC 
GTCGCGCTTT GCATCGGCAA ACTGGCACCC AACCCGCGCA AGGCCCAGCA CTACGCGACC 
CAGATCCGCT CCATCACCAC GGCCGTCGCC GTCGGTACCA TACTGACCTG CTGCACCCAA 
GGTGTCATCG CTGGACTCGG ATACTGGGTT GCAGGAGTCC CGGCCCCGGT TTTCTTCGCG 
GCGCTGACCG CCATCGCCGC CCTGATACCC GTTGTCGGCA CCGCCATCAT CTGGGTCCCC 
ATAGTTGCCC TGACCGCTGT AACCGGCTCC TACCTCACCG CTCTCCTTCT GGCGCTTTGG 
TGCGTCTTTT TCGTCGGCTT CTCGGACAAC GCCATACGTC CGCTTGCCAT AGGCGCGGCC 
AGCGACATCT CGGTGCTGGC TGTGGTCACC GGCGCCCTTT GCGGCGTCGT CATGATGGGG 
CTTCTGGGCC TGATCATCGG GCCGGTGATC TTCGCCGTAC TGTTCAGCAT GTGGGACGAC 
GCGGTAAGCG CAGCGGGAGA CACCGAGTAC AACGATGTCC CCTGA

Protein sequence

MDKKLYLSLI AAFFTVAAIA AIVLFAAPIL KPLAWALIIG IATMPHYQRI LNRFPDRPGR 
ASGLMLLAVA VCLVLPASWL VITAAVNAPE WYRQLEQMIQ EVTRTSSGAL SQIPYYDRIM 
SLVERFGIDL GNIGGKIASS GSTVILNAAT NMVRNLFDFI FTLLVALFLL FFIYRDGERA 
VALCIGKLAP NPRKAQHYAT QIRSITTAVA VGTILTCCTQ GVIAGLGYWV AGVPAPVFFA 
ALTAIAALIP VVGTAIIWVP IVALTAVTGS YLTALLLALW CVFFVGFSDN AIRPLAIGAA 
SDISVLAVVT GALCGVVMMG LLGLIIGPVI FAVLFSMWDD AVSAAGDTEY NDVP