Gene GM21_3440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3440
Symbol
ID	8138807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3976150
End bp	3977694
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	63%
IMG OID	644871056
Product	apolipoprotein N-acyltransferase
Protein accession	YP_003023221
Protein GI	253702032
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0815] Apolipoprotein N-acyltransferase
TIGRFAM ID	[TIGR00546] apolipoprotein N-acyltransferase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	7.79664e-23
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGCTGAACC GCATTACCAG TCACCCCCTT TTTCCGTGGA TCGCCGCTGT TGCCAGCGGC 
ATCCTCTTTT TCTTAGGCTA TGCCGGCTTC GACCAGTTCT ACCTGGAGTG GATCTTCCTG 
GTGCCGCTTT TCTGGGCCCT GCGTGACGCG CGCCCCGGGC GCGCCTTTCT CATCGGCTGG 
GTCGCCGGTA TCGTAGGGCA CGGCGGCGGG TTTTACTGGA TCATCGAAAT GTTCAAGCAG 
TTCGCAGGAG CCCCTCTCCC CTTCGCCCTG GTGGGGCTGG CGCTCTTGGC TGCGGCAAAC 
GGCATCGTGG TGGCCGCCTG GGCTTGGGGA ACCAGGGTGA TCGCCGCCCG CGGCTGGCAG 
GTGATCTGGG TGGCGCCGGT GGTCTGGACC GCGATGGAGA AGTTCTGGCC CGAAGTTTTC 
CCCAACTACC TTGGAGCGAG CCAGTACCGG CTGTCGAATC TGACGCAGAT AGCGGATTTC 
GCAGGCGTCC TCGGGGTGAG CTTCCTCGTG GTCTACATCA ACGCGACGCT GTACTGGGTG 
ACCGCCTGCT GGTTCGAGGA AAAGCGCCTC CCCTGGCGTG CGCTGTCGGC CTTGGCGCTA 
TCGCTTCTGT TCGTGCTGGG CTACGGAGAG ATGCGGCTTA AGGAAGTGGA GCGGCAGGTA 
GCAACGGCGC AGACCCTCAA GGTCGGGCTG GTACAGGCGA ATCGGGGTGC CGCGGACCTG 
CACATCGACT CCGACACTGT GCTGCAGGAG CACCGGGACA TGTCGCGGCT CCTGGTAGAA 
AAGCAAAGGC CGGACCTGGT GGTCTGGCCG GAAGGGGTGC CGGTGAGCCT TTCCTCCCGG 
GAAGGGGTGC TCCCAACCGC GGCACTCGGG GACCTGGGCG TCCCGCTTCT CTTCGGCGCC 
TGCCTGCGGG TAGCCGACGG GATCTGCAAC AGCGCCTTTC TGGTCGACGC CTCCGGGCGC 
ATCCTTGGGA GCTACGACAA GACGGTGCTG GTTCCTTTCG GAGAGTACAT TCCCTTCGGC 
GACACCTTCC CCAGCCTCTA CTCCTGGTCT CCCTACTCGA GCCGCTTCTG GCGCGGCCAA 
AGCGAAGAGC CGCTCCGACT GGGAAATCGC GTGCTCTCGC TCAGCATCTG CTATGAAGAC 
ATCTTCCCGC TGCACATCAG AAAGCTCATG GCCGGCGGGA AGGGGAGACG GGTTCCCGAG 
GCGATGTTCA ACCTCACCAA TGATTCCTGG TACGGCAACT CGATCGAACC GGTGCAGCAT 
CTGGCGCTGG CCAGCTTCCG CTCCATCGAG AACCGCCGCT CTCTGGTACG CGTCACCAAT 
ACCGGCATAT CCGCATTCGT GGATCCTGCC GGGCGCATCG TCAAGAGTAC AGGCATCTGG 
ACCAAGGAGG TCCTGGTGGA CAAGATCCCG CTGTTACAGG GGAGGCGCAC CCCGTATTCG 
GTGGCCGGAG ACTGGATCGG CTGGCTCTGT GCCTTGCTCA CTGCATCAGC GATAACTTCG 
GCCTATGTCT CGACGCGTCG CAAGAGAGAA GCTGAAAAAG GGTAA

Protein sequence

MLNRITSHPL FPWIAAVASG ILFFLGYAGF DQFYLEWIFL VPLFWALRDA RPGRAFLIGW 
VAGIVGHGGG FYWIIEMFKQ FAGAPLPFAL VGLALLAAAN GIVVAAWAWG TRVIAARGWQ 
VIWVAPVVWT AMEKFWPEVF PNYLGASQYR LSNLTQIADF AGVLGVSFLV VYINATLYWV 
TACWFEEKRL PWRALSALAL SLLFVLGYGE MRLKEVERQV ATAQTLKVGL VQANRGAADL 
HIDSDTVLQE HRDMSRLLVE KQRPDLVVWP EGVPVSLSSR EGVLPTAALG DLGVPLLFGA 
CLRVADGICN SAFLVDASGR ILGSYDKTVL VPFGEYIPFG DTFPSLYSWS PYSSRFWRGQ 
SEEPLRLGNR VLSLSICYED IFPLHIRKLM AGGKGRRVPE AMFNLTNDSW YGNSIEPVQH 
LALASFRSIE NRRSLVRVTN TGISAFVDPA GRIVKSTGIW TKEVLVDKIP LLQGRRTPYS 
VAGDWIGWLC ALLTASAITS AYVSTRRKRE AEKG