Gene Lcho_4056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_4056
Symbol
ID	6162889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	4542212
End bp	4543594
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	77%
IMG OID	641666834
Product	hypothetical protein
Protein accession	YP_001793073
Protein GI	171060724
COG category	[M] Cell wall/membrane/envelope biogenesis [S] Function unknown
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins [COG3455] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03349] type IV / VI secretion system protein, DotU family [TIGR03350] type VI secretion system OmpA/MotB family protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0000056515
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGCCC AGCCCCCCCG CCCCGGTGCC GGTCCGAACG ATCCGCACGA TCCGTTCGCG 
GCGCTCGACA GCGGCGCCAC CGTCATCCGC CCCAACCCCG GCGCCCGCGC CGCGCCGGCG 
CGCATGCCGG CCGCCCAGGA GCCGCCGGCC GCCGACACGC CGCTGCCGGC GCAGGGCCTG 
AATCCGCTGG TCAGCCTGGC CAACCGCCTG CTGCTGGCGG TGCCGCAGCT GCGCGCGACC 
CGCCACGTCG CCGACCCCGC CGCGCTCAAG CACAGCCTGG CGCAGGCGGT GCGCGACTTC 
AGCACCGCCG CCGCCGCCGC CGGCATCACG CCGCAGCAGG TGATGGCCGC GCGCTACGTG 
CTGTGCACCG TGCTCGACGA GGCCGCCAGC GACACGCCCT GGGGCGGCGC CGGCGTGTGG 
GCCCAGCACA GCCTGCTGGT GACCTTCCAC AACGAGGCCT GGGGCGGCGA GAAGGTCTTC 
CAGCTGATGG CCCGGCTGGC CGGCCAGCCG GCCGAACACC GCGACCTGCT GGAGCTGATC 
TACGCCGCGC TGGCGCTCGG TTTCGAGGGG CGTTTCCGCG CCATCGAGAA CGGCCGCGCC 
CAGCTCGACG CGGTGCGCGA CAAGCTCGCG CGCATCGTGC TGCAGGCGCG TGGCGACCAC 
GCCCCGGCGC TGGCGCAGCA CTGGCAGGTC GAGGCGGTGG CGCAGCGCGC GCTGCCGGGC 
TGGCTGCCGC TGCTGGTGAC GGCGCTGGTG CTGGGCCTGC TGCTGGTGGC CGCCTACATC 
GGCCTGAGCT TCTGGCTCGG CGCGCGCTCC GACCCGGTGT TCGGCCAGAT CCAGGGCCTG 
CGCCTGAACC CGCCGGTGGC CGCGGTGGCG CAGCCGGCGC CGCAGCCGCG GCTGGCGACC 
TTCCTGCGGC CCGAGATCGC CGAGGGCGCG GTGGTGGTGC GCGACGAGGT CGACCGCAGC 
GTCGTCACGC TGCGCGGCGA CGGCCTGTTC GAGCCCGGCA GCGCCACGCT CGCCGCGCCC 
AAGGAGGCGC TGCTGCGGCG CGTGGCCGAC GCGCTGGCGC AGTTCGGCGG CGCGGTGCTC 
GTCACCGGCC ACACCGACAG CCAGCCGATC CGCTCGGCGC GTTTCCCGTC CAACTGGCAC 
CTCTCGCAGG AGCGCGCCGG CGCGGTGCGC GAGCTGCTGG TGAGCCAGCA GGTGGCCACC 
GAGCGGGTGC GCGCCGAGGG CCGCGCCGAC GGCGAGCCGG TGGTCGCCAA TGACAGCGCC 
GGCAACCGGG CGCTGAACCG GCGCGTCGAG ATCACGCTGT TCGTCGCCGC GCCGCCGGGC 
GTGGCCACGG CCGCCAGACC CGCAACCCCC ACGGCCACGC CCGCATCCGG AGCCCGGCCA 
TGA

Protein sequence

MSAQPPRPGA GPNDPHDPFA ALDSGATVIR PNPGARAAPA RMPAAQEPPA ADTPLPAQGL 
NPLVSLANRL LLAVPQLRAT RHVADPAALK HSLAQAVRDF STAAAAAGIT PQQVMAARYV 
LCTVLDEAAS DTPWGGAGVW AQHSLLVTFH NEAWGGEKVF QLMARLAGQP AEHRDLLELI 
YAALALGFEG RFRAIENGRA QLDAVRDKLA RIVLQARGDH APALAQHWQV EAVAQRALPG 
WLPLLVTALV LGLLLVAAYI GLSFWLGARS DPVFGQIQGL RLNPPVAAVA QPAPQPRLAT 
FLRPEIAEGA VVVRDEVDRS VVTLRGDGLF EPGSATLAAP KEALLRRVAD ALAQFGGAVL 
VTGHTDSQPI RSARFPSNWH LSQERAGAVR ELLVSQQVAT ERVRAEGRAD GEPVVANDSA 
GNRALNRRVE ITLFVAAPPG VATAARPATP TATPASGARP