Gene GM21_0068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0068
Symbol
ID	8135367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	85955
End bp	87124
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	67%
IMG OID	644867685
Product	hypothetical protein
Protein accession	YP_003019913
Protein GI	253698724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	3.19832e-26
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGTATC CCGTTTCGCC GCTGATCTCA GGCGTGCACC CGCCTCCCAT CTCCGAGGTG 
AAGGGTTGGC TCGCCGGGGC CCCGGCCGGG GTTCCCCTCA TCGACCTCTG CCAGGCCATA 
CCCGATTACC CCCCGCCGCG GGAGCTCACC GACCACCTGG CCCAGGTGAT GCTCGACCCG 
CACACCTCGC GCTACAGCAT CGACGAAGGG CTTCCCGAGG TGCGGGAGGC GGTCTGCGCC 
GGGTACCGCG AGCTCTACGG CGCCTGCATC GATCCTGCCC AGCTCATCCT CACCATCGGC 
GCCAGCCAGG CTTTCTGGCT CGCCATGGTG ACGCTTTGCC GCGCCGGAGA CGAGGTCATC 
GTCCAGCTGC CGGCCTACTT CGACCACCCG ATGGCGCTCG CGGTGCTCGG CATCCGCTGC 
GTCTACGCCC CGTTCGAGGA GGAAAGCTGC GGGCTCCCCA GTGTCGCCGC CATAGCCCCC 
TTGATCACGG AGAAGACCCG CGCAATTCTG CTGGTCACCC CCAGCAACCC CACCGGCGCC 
GTGATACCGC CCGAGACCGT GCGCGAGTTG CACCGCCTCG CCGTCTCCCG CGACATCGCC 
TTGGTGCTGG ACGAGACCTA CAACAGCTTC ATCACGGGGG GCGCCCGCCC CCACGACCTG 
TTCCAGAAGC CGAATTGGGG GGACCATTTC GTCCACATCG CCTCCTTCGG CAAGACCTTC 
GCGCTCACCG GCTACCGCGC CGGGATGCTG GCCGCGTCGG AGGAATTCAT CCGCCACGCG 
CTGAAGGCGC AGGACACCAT GGCGGTATGC CAGCCGCGCG TCACACAGCA CGCGGTGAAG 
TACGGCTTCG AGCAGCTGGG GGGATGGGTC GCCGCGAACC GGGTCATGAT GGAGAGAAGG 
CACGAGGTGT TCCGCGCCGA GTTCGAGAAG CCCGGCAACT CCTTCAAGCT GGTGGCGAGC 
GGCCCCTTCT TCGGCTGGGT GCGGCATCCG CTGCGAAATG CCGCGGGGAG GGAGGTCGCC 
AGGCGCCTGG TGGAAGAGGC GGGGGTGCTG CTGCTGCCGG GGGAGGTGTT CGGACCGGGG 
TTGGAGGGGT ACTTAAGGCT CGCCTTCGGC AACATCAGGG AAGAGACCAT ACCCGAGGCG 
GTGAAACGGT TCAGGGAATT CAAAACCTAA

Protein sequence

MRYPVSPLIS GVHPPPISEV KGWLAGAPAG VPLIDLCQAI PDYPPPRELT DHLAQVMLDP 
HTSRYSIDEG LPEVREAVCA GYRELYGACI DPAQLILTIG ASQAFWLAMV TLCRAGDEVI 
VQLPAYFDHP MALAVLGIRC VYAPFEEESC GLPSVAAIAP LITEKTRAIL LVTPSNPTGA 
VIPPETVREL HRLAVSRDIA LVLDETYNSF ITGGARPHDL FQKPNWGDHF VHIASFGKTF 
ALTGYRAGML AASEEFIRHA LKAQDTMAVC QPRVTQHAVK YGFEQLGGWV AANRVMMERR 
HEVFRAEFEK PGNSFKLVAS GPFFGWVRHP LRNAAGREVA RRLVEEAGVL LLPGEVFGPG 
LEGYLRLAFG NIREETIPEA VKRFREFKT