Gene GM21_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1203
Symbol
ID	8136528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1407548
End bp	1408942
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	64%
IMG OID	644868817
Product	type VI secretion protein, VC_A0114 family
Protein accession	YP_003021022
Protein GI	253699833
COG category	[S] Function unknown
COG ID	[COG3522] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03353] type VI secretion protein, VC_A0114 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	170
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCCA TCGAGAGGCA GGTATTCTGG CACCAGGGGC TGTTTCTGCA GCCCCAGCAT 
TTCCAGCTCT CAGAGCGCTC GTTGCAGTCG CAACTGGCTC CGTACCAGTT GTGTCTCATG 
CCTGACTTTT GGGGCGTGCA ACGGATGGAG ATCAGGTGCA CAGCCGGCGG GATACCTAGC 
CTCGAAATTT CCGGCGCCTT CCTTTTTCCC GACGGCACCT ATGCCGTCGT CGCTGAGAAC 
GCGCGGGCCG AGTCCAGGCC GGTCCTCGAA GAGGCAGTGG CGGGAAGGGA TTCCTGTACC 
GTCTACCTTG GCTTGAAGAA ATGGAGCCCC GCCGGCCATA ACGTCACCAC CTTGCTCCCT 
GGCGCCCCCC TCTCCAAGGT CGCTACGCGC TTCGTTGCCG AGTCCGACGC CGCGCCCCGT 
GCCGATCTCC ACGCAGGGGG GGCTGAGGCG GAGGTGCGGC AGATGGCTTT GACCCTGCAG 
CTTTTCTGGG AGAGCGAGCT GGAGTCGTTG GGGGATTACC TGCTCATCCC TGTCGCCCGG 
CTCGCGCTGC GCGGCGAAAC CGCGGTGCTC TCCCGTGACT TTATCCCCCC CTGCATCACC 
CTGTCCGGCT CATCCGCGCT CTTCGACCTG CTCCAGGAAA TCCGGGAACA GCTGGCCTCC 
CGCTGCCGCT GGCTGGAGGG TTACAAGAAG GAACGGGGCA TTCAGGCCGC TGAGTTCGGT 
TCCAAAGATC TGGTTTTCCT CCTGGCCCTC AGAACCGTGA GCCGGCACCT AGCGAGGCTT 
AGCCACTGGA TCGAGGCGGG TGAGGTTCAC CCTTGGCAGG TTTACGGGCT TCTGGGAGAG 
CTCGCCGCGG AACTGACCTG CTTCTCGGAG ACCACCGGCG CCTTCGGTGA GTCCGTGGCC 
GACGGGCCAA GGCTCATGCC GCAGTACCGG CACAAAGATC TGGGGTGCTG CTTCCGGCTG 
GCCCGCGATC TCATCGTCCA GCTGCTGAAC GAGGTGACCG CGGGGCCGGA ATACGCACTG 
ACCCTCGCCT TCGACGGGAC CTGGTTCGCC TCCGATCTCA AGCCCGCGCA CTTCCAGGGG 
CACAGCAGGT TTTACCTGGT GCTGAATACG AACGAGGATC CGAAACTCGT CCTTGCTTCG 
GTCGCGACCG CAGCGAAGCT GACCGCGCGC GAACGGTTGC CGCTGTTGAT CTCCCAGGCG 
CTCCCGGGGA TCGCCCTGGA GCATGTCTCC GATCCCCCCC GCGAACTGCC GCATCGCTCC 
ACCTCCCTCT TTTTCAGCAT AGACAGCCGC TGCGATCAGT GGGAGCTGGT GCGGAAGTGG 
AATAATATCG CGCTCAGCTG GGACCAGGCC CCAGCCGACC TCGAAGTGCA GCTCATGATC 
GTTGCCAGGT CCTAG

Protein sequence

MMSIERQVFW HQGLFLQPQH FQLSERSLQS QLAPYQLCLM PDFWGVQRME IRCTAGGIPS 
LEISGAFLFP DGTYAVVAEN ARAESRPVLE EAVAGRDSCT VYLGLKKWSP AGHNVTTLLP 
GAPLSKVATR FVAESDAAPR ADLHAGGAEA EVRQMALTLQ LFWESELESL GDYLLIPVAR 
LALRGETAVL SRDFIPPCIT LSGSSALFDL LQEIREQLAS RCRWLEGYKK ERGIQAAEFG 
SKDLVFLLAL RTVSRHLARL SHWIEAGEVH PWQVYGLLGE LAAELTCFSE TTGAFGESVA 
DGPRLMPQYR HKDLGCCFRL ARDLIVQLLN EVTAGPEYAL TLAFDGTWFA SDLKPAHFQG 
HSRFYLVLNT NEDPKLVLAS VATAAKLTAR ERLPLLISQA LPGIALEHVS DPPRELPHRS 
TSLFFSIDSR CDQWELVRKW NNIALSWDQA PADLEVQLMI VARS