Gene GM21_1242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1242
Symbol
ID	8136567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1448604
End bp	1450253
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	61%
IMG OID	644868856
Product	hypothetical protein
Protein accession	YP_003021061
Protein GI	253699872
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	8.74975e-30
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCAAA AGAATGGCAG TAGAGTGCTT ATGATGCTGT TTGTCTTTGC GATGACCCTG 
GTGTCCTTTC AGTTTTGGCG CACCGAGGCG CAGGCGCAAT CCTCTTATTT CACCAGCAGA 
GGTTGCGTAA CTTGCCACGG CGCCCCCACG GTTACCACCT GTGCCGGGTG CCACTATCAC 
AGCGGCACCT TGTCCGCCAC CACCAACAAG ACGACCTCCT ACGCCCCCGG CGAGACGGTG 
ACTGTCACCC TGACCGCTTC AGGCGCACGC TCCGGCTGGA TCGGCGCACG CCTCTATAAC 
CAGGCTGGCG TCGAAGTGGC GCGTTCCACG GGCGCCCAGA GCGGCATGGG TGGTGCGACA 
ATCTATCCGG CTGTTCTCTC GGCTCCGGCC CCCGCCGCCG CAGGTACCTA TAGCTGGAGG 
ATGGCTTATC TCGGCAATGA CCTCACGGGA TCCGGCGACG TGCACAGCGA GAAATCGGTC 
AACGTTTCCG TAACCGTTGC CGCAGTCCCG GTCGCCGACA CCACCGCGCC GGTCGTAGCC 
ACCTTCACCC TGCCGGCGAG CTCCACCAGC CTGAACGTTC CGGTCTCCGC CCTGAGCGCG 
ACCGATAACG TCGCCGTCAC CGGCTACCTG GTGAACAAGG TCGCGAGCGC GCCGACCGCA 
TCCGCAGCAG GGTGGAGCGC CACCGCTCCG ACAAGCGTCA CCGCCGTCGC CGGCAGCAAC 
ACCTTCTACG CCTGGGCCAA GGACGCGGCC GGCAACATCT CGCTGGCAAA AAGCGCCAGC 
GTCACCGTTA CCATCGAAAC GGCCGATGTC ACCGCACCGA CCGTCGTAGT TTCTACCCTC 
GCAAACGGTT CCTACACCAA TAAAGCAACC CTCAACATCA GCGGCAACGT CAGCGATGAA 
GGCGGCTTGC AGTCCTTCAC CGTCAACAGC CAGCCTGTAA TAGTAAACGC GGACGGTTCT 
TTCAGCACAG CCTTCCCCTT GGTGGCCGGA GCAAACACCG TGACTATCGT TGCCACCGAC 
GTGGCCGGCA ATCAGCAGAC CGATGTTCGT ACCATCAACT ATGATCCGAC CGCACCGGTG 
CTTGCAGTCA CCGCCCCCGG CGACAACAGC ATCTCCGCCC AATCATTCAT AACGCTGACC 
GGTACCATCA GCGAGACTTC CACTGTCACC GTCACCGGCA ATGATGGCAG CCAACAATCA 
GCCGCCGTCA CTGGCAGCAA CTTCATCGCC ACCGCCAACC TCGTTGCCGG CGTCAACACC 
ATCACCATCA CCGCAACCGA CCTGGCCGGC AACACCGCCA GCGCCAAGCG GACCGTAACC 
TATGAAGGCG GAACGATGAC CATAGCTATC ACCAGGCCGA GCCAGGACAT CACCACCAGC 
AGAAATTCCA TCGTTGTGGA GGGCAAGATC GTCGATGCAG TAGGCAAGAT CTCGGTAAGC 
CTGCAGGTAA ACGGCCGCAT CTACTTTCCC AACGTCGACG AAAATGGTCT CTTCAAGCAG 
GCACTCTTCT TCCAGAAGTC CGGTCTGTAC ACTATCCTCG TTACCGCCAA GGATGCTGCC 
GGCAACAGCA GCACGGTGAC CCGCAACGTG ATCTTCCGCA AGTACGATGA CCACGACGAT 
TACCATGGTG ATGAGCGCGA CGACGATTAA

Protein sequence

MNQKNGSRVL MMLFVFAMTL VSFQFWRTEA QAQSSYFTSR GCVTCHGAPT VTTCAGCHYH 
SGTLSATTNK TTSYAPGETV TVTLTASGAR SGWIGARLYN QAGVEVARST GAQSGMGGAT 
IYPAVLSAPA PAAAGTYSWR MAYLGNDLTG SGDVHSEKSV NVSVTVAAVP VADTTAPVVA 
TFTLPASSTS LNVPVSALSA TDNVAVTGYL VNKVASAPTA SAAGWSATAP TSVTAVAGSN 
TFYAWAKDAA GNISLAKSAS VTVTIETADV TAPTVVVSTL ANGSYTNKAT LNISGNVSDE 
GGLQSFTVNS QPVIVNADGS FSTAFPLVAG ANTVTIVATD VAGNQQTDVR TINYDPTAPV 
LAVTAPGDNS ISAQSFITLT GTISETSTVT VTGNDGSQQS AAVTGSNFIA TANLVAGVNT 
ITITATDLAG NTASAKRTVT YEGGTMTIAI TRPSQDITTS RNSIVVEGKI VDAVGKISVS 
LQVNGRIYFP NVDENGLFKQ ALFFQKSGLY TILVTAKDAA GNSSTVTRNV IFRKYDDHDD 
YHGDERDDD