Gene Sfum_0540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_0540
Symbol
ID	4460578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	658509
End bp	660419
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	59%
IMG OID	639701296
Product	type IV pilus secretin PilQ
Protein accession	YP_844674
Protein GI	116747987
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4796] Type II secretory pathway, component HofQ
TIGRFAM ID	[TIGR02515] type IV pilus secretin (or competence protein) PilQ

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.614076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.439492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTACG TCGGTTTTCG AAAAATGAGC TGTTTCGCTT TTGTATTGGT GTTTGCCTTG 
TGCTGGGCTT GTGCGATTCC CGGCTCCGTC GAAGGCGGAT CCAGCCCGAA AGCCGGTGTT 
GCGAGCCCGA GCCCTGCGGC AGCCACGCCG ACGGCCGAAT CTGCAACGGC GGGAAAAGGC 
GCGAAGTTGT TGAGTGTCGC TATGGACGAA TCCGGGTTGG AGACGGTGCT CAGGATAGCG 
GGCAGCGGCC CCTTGAAGGA TTATCAATTC CGGCGCCTGG GCGAAGACAG ATTCGTGCTG 
GAAATCGGGG ATGTGACCGC CAGGGCGGCC AAGCCCGCGC TGCCCGGCAA GTCGAGCAGG 
GTCAAGCTCA ACTATGCGCG AGCGAAGGCG GGGGTCCGGA TCGTCGGGAA TGTCCGGCAG 
CCCATCAGTG ATTATACCGT CGACAGTGTC GACAACGACA TTGTTGTGAA CCTGCGTTTC 
GCGGAAAAGA AGCAGGTTGC GGCGGCCGGC GCCGCTGCGG AGAAACCTGC CACGGCGGAA 
AAGACCAGGC CGGGCAAGGC TGCGGCGCGC CGTGGAGCCG GCGATGCCGG GGAGGAAGTC 
CAGGGGGCGG ACCAGCAGTT CCCCGAATAT TCAGCCACCA GGCCGGGGGG GGGAGCCCCC 
GAATTGCGTC ATGCCAGGAA GCAGTACACG GGCAAACCGA TCAGCCTTGA TCTGCTCGAC 
GCCGATCTGC GGAACGTCCT GCGGCTTCTG GCCGATCTGA CCGGGACGAA CATTGTGATC 
GAACCGGACG TCACGGGCAA GGTGACCCTG AAGGTGGAAC AGGTCCCATG GGATCAGGTT 
CTGGACATGA TCATATCCAT GAACGATCTG GGACAGGAGC AGGTCGGGAG CGTGATTCGC 
ATCGCCAGGC GGAGCAAGCT CAAAAGCGAA TGGGCCCAGC AGGCGGAAGC CATCAGGGCC 
AAGCAGGAAT ACCTGTTGAC CAGCAAGGAT CTGGGAGAGA TCAATACGGC ATATCTTACG 
GTGAACTACG CCCAGGTGAC CGATGTCGCC AGCAAGATCA ACGAGGCGAA GAGCGATAAG 
GGCAAGGTAT CCGTCGACGA GCGGACGAGC CTGATCATTT ACAGCGACTA TCCGGGCCGT 
ATCAACAACG CCAGGATGCT TCTGAACAGG CTTGACCGGC CCACTTCCCA GGTGCTCATC 
GAAGCCCGCA TCATCACGTT GACTTCGGAA GTCAAACGGT CCCTCGGCAT GAACCTGGGC 
TTCGGCGGCG ATACCCCGAA TCATTCGGCG ACCGTGCCGT TCACGGATTT TCTGATCAAC 
AGCCCGCCGG CCAATCTGTT CGCTCTGAAC CTTGCGCAGA TGGTCGGTAC GACGCTGCTG 
AAAGTGGACC TCACTATTTC GGCCCTCGAA ACCGCCGACG AGATTCGCAT CATGGCGGCT 
CCGAGAGTTC TGACCATGAA CAACGTCAAG GCAGTGATCT CCCAGGGTGT GCAAATTCCC 
TACCTGAAGG TCGGCGATAC GGCATCCAAC ATCACGGGCA CGGATTTCAA GGACGCCGTG 
CTCGAGCTCG CCGTGACGCC GCATATCACT CCTGACCACA AGGTGCGGAT GACCATCGAG 
GCAAAACAGG ACGAACCCTC GAGCACCGTA ACCGGAGCGC AGGGGCAGCC CGGTATCGAT 
ACGAGAAAGA TTTCCACGGA ACTGCTGGTG GATGACGGCA ACATCATTGT GATCGGCGGC 
ATCATCCGAA ATCGGGATGA AGCCAAGAAG ACGGCCACGC CCGGACTCAG CGACGTCCCC 
ATTCTGGGCA GGCTGTTCAA ATCAAACGAG GTCGATGCGC AAAGAAACGA AATTTTGATT 
TTCATCTGCC CGAAAATTGT GGATGTGACG AAACCTTCTG ATCGCACATA G

Protein sequence

MHYVGFRKMS CFAFVLVFAL CWACAIPGSV EGGSSPKAGV ASPSPAAATP TAESATAGKG 
AKLLSVAMDE SGLETVLRIA GSGPLKDYQF RRLGEDRFVL EIGDVTARAA KPALPGKSSR 
VKLNYARAKA GVRIVGNVRQ PISDYTVDSV DNDIVVNLRF AEKKQVAAAG AAAEKPATAE 
KTRPGKAAAR RGAGDAGEEV QGADQQFPEY SATRPGGGAP ELRHARKQYT GKPISLDLLD 
ADLRNVLRLL ADLTGTNIVI EPDVTGKVTL KVEQVPWDQV LDMIISMNDL GQEQVGSVIR 
IARRSKLKSE WAQQAEAIRA KQEYLLTSKD LGEINTAYLT VNYAQVTDVA SKINEAKSDK 
GKVSVDERTS LIIYSDYPGR INNARMLLNR LDRPTSQVLI EARIITLTSE VKRSLGMNLG 
FGGDTPNHSA TVPFTDFLIN SPPANLFALN LAQMVGTTLL KVDLTISALE TADEIRIMAA 
PRVLTMNNVK AVISQGVQIP YLKVGDTASN ITGTDFKDAV LELAVTPHIT PDHKVRMTIE 
AKQDEPSSTV TGAQGQPGID TRKISTELLV DDGNIIVIGG IIRNRDEAKK TATPGLSDVP 
ILGRLFKSNE VDAQRNEILI FICPKIVDVT KPSDRT