Gene Lcho_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3042
Symbol
ID	6161569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	3359423
End bp	3360508
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	70%
IMG OID	641665817
Product	hypothetical protein
Protein accession	YP_001792067
Protein GI	171059718
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00000069589
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGAGA CCACCCTCAG CCGCACGGCG ATCTTCAGCG CCCGCCCGAC GCTGCGCATC 
GCCGACCAGC CCGACGAGCG GCTGTCGACG CTGATGACCG CGCTGAAGAT GGACGAGTCC 
GAAGGCGGCC TGAGCGCACT CGAACTGCAC CTGACCAACT GGGTGGCCAC CCCCGAGGGC 
GGCGCCGAGC TGGCCTTCAA CGCCGACAGC AGCCTGCGCC TGGGCGCGGA CCTGGCGGTC 
TATTGCGGTG ACGAGGCAAG CCCGCGCGAA CTCTTCAAAG GCAAGGTCAC GGCACTGGAG 
ATGGTCTGCA ACTACGGCAC ACCGCCCGAA CTCGTGGTGC TGGCCGAGGA CGGCCTGAAC 
GCCGCGCGAC GCAACCGCCG CAGCGAGGTC TACACCGACC AGAGCCCGGC CGACGTGGTG 
CGCACGATCG GCGCTCGCAA CGGCCTCACG GTCAACGTCA ACGGCCTCGC CAGCCCGACC 
GGCACCTGGG TGCAGCTCGA CGAAACCGAC CTCGGTTTTC TGCGCCGGCT GCTGGCGCGT 
TTTGACGCCG ACCTGCAAGT GGTCGGCAGC GAACTGCAGG TGGCGGCCCG CCAGGATGCC 
GCACGCGGCG AGATCGAGCT GACGCTCAAC AGCCAGCTGG CCCGCGTGCG CATCTGCGCC 
GATCTGGCGC ACCAGGCCAG CGCCGTCAGC GTGGCCGGCT GGAATGCGGG CGACGGCAGC 
GCCGTCAGCA GCGAGGCGAG CAGCCTGTCG AGCACCGGGC CGGGCTCGGG CCGCAGCGGC 
ATCGACTGGG CGAAAGATGT CTTTGGCGAG CGCAGCGAGC ACCTCGCCAC ACCCGCGGTC 
GGCAGCAACG ACGAGGCCCG CGCAGTCGCG CAAGCCGCGC TTGATCAGCG CTGCCGCCGC 
TTCGTGCGTG CCGAGGGGCT GTCCGAAGGC AACGCGCAGC TGCGGGTGGG CAGCACCGTG 
AAGCTGGTCG GCATCTCGGC GCAGTTCGAC AACCGCTACT ACGTGGTGCG CACCCGCCAC 
CTGTTCGACA TGGAACAGGG CTACCGCACC GAATTCAGCG CCGAGTGCGC CTACCTCGGC 
GGCTGA

Protein sequence

MSETTLSRTA IFSARPTLRI ADQPDERLST LMTALKMDES EGGLSALELH LTNWVATPEG 
GAELAFNADS SLRLGADLAV YCGDEASPRE LFKGKVTALE MVCNYGTPPE LVVLAEDGLN 
AARRNRRSEV YTDQSPADVV RTIGARNGLT VNVNGLASPT GTWVQLDETD LGFLRRLLAR 
FDADLQVVGS ELQVAARQDA ARGEIELTLN SQLARVRICA DLAHQASAVS VAGWNAGDGS 
AVSSEASSLS STGPGSGRSG IDWAKDVFGE RSEHLATPAV GSNDEARAVA QAALDQRCRR 
FVRAEGLSEG NAQLRVGSTV KLVGISAQFD NRYYVVRTRH LFDMEQGYRT EFSAECAYLG 
G