Gene GM21_3549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3549
Symbol
ID	8138921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4110327
End bp	4111487
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	644871168
Product	protein of unknown function DUF214
Protein accession	YP_003023328
Protein GI	253702139
COG category	[V] Defense mechanisms
COG ID	[COG0577] ABC-type antimicrobial peptide transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	152
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAC GCCGCTGGCT CTCCCATATC GTCATCAGGG CGCTGGCCCA CAGAAAGGGG 
CGCACCGCGC TCCTCGTCGC CGTCCTCACC ATGGCGTCGA GCCTCGCCAC CGCCCTTTGC 
ATCGTCTCCG CCTCGATGGG GGAGAGGGTG GCCGAGGAGA CCAGGCGCTA CGGAGCGAAC 
CTCCTGATCC TCCCCGAGGC CGCCCGCATC GAGGTGGGAA GCGGCGCCCT CAGGTTCGGG 
ACCGTCGGCG AGCCGGCCTA CCTGGACCAG GAACAGGTGG TCTCGGTGCT TGCCGCGAGC 
GGCGCGGGGG AGGATTATTC CCTGCACCTC AAAGCGGCGC TCACCCTGAA CGGGGCCGAG 
CTTCCCTGCG AAGGGGTCGA GTTCGACCGG GTGCGGCGGC TTGCCCCCTG GTGGCAGTTG 
CGCGGCGCCT GGCCCAAAGC GGGCGAGGCG CTGGTGGGTA CCGACCTTGC GGCCCGCTAC 
CGCCTTAAGC CCGGCGACAC GCTGGCGCTC GGCGGGAAGA GCGCGACCCT CAAGGTCGCC 
GTCGCCGGTA TCGTCAGCAC CGGCGGCGAG GAGGACGGCG TGCTCTTCCT CCATTTGAAT 
GAGCTGCAGC GGGAGGCGGG GCATCCGGGA GAGGTTAGCC TCGTGCGGTT GCTGGTAGAT 
CCCAGCCGGG GGAGCGTCAA GGGGAAGGCG AAAGAGCTGC AGCCGCAGCT CTCGGGCGCG 
GTGGTGAAGG AGTTGCGCCA GGTGGGGCGG ACCAGCGAGG AGCTCCTCGG GAAGGTACAG 
CTTTTGATGC TGTTGGTGAC GCTGGTGGTC CTTGTCTGCG CCGGGAGCAG CGTCGCCGGG 
ACCATGAGCG CCACCGTGCT GGAGCGCGGC AAGGAAATCG GGCTCATGAA GGCGATGGGG 
GGGACCCGCT GGGACCTCTT GCGCATCTTC AGCGCCGAGG CGCTGCTTTT GGGGGGCGCC 
GCGGGGATGA CCGGGTATCT GTTGGGGAGC GCCATCGCCC AGTTCGTGGC GCGGAGCGTT 
TTCGCCGCCT CCGCCGGTTT CGCCCCGGCC TATTTCCCGG TGGCGCTGGG AGTGAGTCTC 
TCGCTGGCGC TCGCCGGGAG CCTCGGCCCG CTCGTCTCCG TGTTCCGGCT CGACCCGGTG 
CAAAGTCTGC GCGGAGAATA A

Protein sequence

MSKRRWLSHI VIRALAHRKG RTALLVAVLT MASSLATALC IVSASMGERV AEETRRYGAN 
LLILPEAARI EVGSGALRFG TVGEPAYLDQ EQVVSVLAAS GAGEDYSLHL KAALTLNGAE 
LPCEGVEFDR VRRLAPWWQL RGAWPKAGEA LVGTDLAARY RLKPGDTLAL GGKSATLKVA 
VAGIVSTGGE EDGVLFLHLN ELQREAGHPG EVSLVRLLVD PSRGSVKGKA KELQPQLSGA 
VVKELRQVGR TSEELLGKVQ LLMLLVTLVV LVCAGSSVAG TMSATVLERG KEIGLMKAMG 
GTRWDLLRIF SAEALLLGGA AGMTGYLLGS AIAQFVARSV FAASAGFAPA YFPVALGVSL 
SLALAGSLGP LVSVFRLDPV QSLRGE