Gene Lcho_3031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3031
Symbol
ID	6162468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	-
Start bp	3348587
End bp	3350452
Gene Length	1866 bp
Protein Length	621 aa
Translation table	11
GC content	73%
IMG OID	641665806
Product	allophanate hydrolase
Protein accession	YP_001792056
Protein GI	171059707
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0154] Asp-tRNAAsn/Glu-tRNAGln amidotransferase A subunit and related amidases
TIGRFAM ID	[TIGR02713] allophanate hydrolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.153598
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC CCTTGTTGTA TACCAGTGAG TGCACCAAAA CCGTGACATC CACCACACAA 
GCCCCCCGTA CCCTGACGCA ATGGCAAGAG GCCTACCGGG CCGGAGCCGA GCCGGCGGAC 
CTGCTGCCGG CGCTGCGACA TCGGTTGATC CGTGGTGACG ATCCGGCGGT GATCCGCTGG 
GTGACGGGCG ACGAGTTGGC ACGCCGCCTC GGCCAGCTGG CCGAGGTGGC CGCGGCCCAT 
GCCGACCGCG CCGCGCTGCT CAAGGTGCTG CCGCTGTTCG GCGTGCCGTT CGCGGTCAAG 
GACAACATCG ACATCGCCGG CATCGAGACC ACCGCCGCCT GCCCGGCCTT TGCGCACGTG 
GCCGGCCAGT CGGCCGAGGC CGTGCGCCGG CTCGAAGCAG CCGGTGCGGT GTGGATCGCC 
AAGACCAACC TCGACCAGTT CGCCACCGGC CTGGTCGGCG CTCGCAGCCC CTACGGCCGG 
CCAGCCAGCG TGTTCGACGC CGCGCGCATC AGCGGCGGAT CCAGTTCGGG CTCGGCGGTG 
CTGACCGCGC GTGGCGACGT GGCTTTTGCG CTCGGCACCG ACACCGCCGG CTCGGGTCGC 
GTGCCGGCGG GTTTCAACGA ACTGGTGGGC CTCAAGCCGA CGCCCGGGCG GGTCAGCACC 
GCCGGCGTGC TGCCGGCCTG CCGCAGCCTC GATTGCGTGT CGGTGTTCGC CCACTCGGTC 
GAGGACGCCG CCGTGGTGCT GTCGGTGATC GAAGGCGCCG ATGCGGCCGA TGCCTACAGC 
CACTTCGCGC CCGGCCCGTC GACCTGGGCG CCGCGCCTGA AGGTGGGCGT GCCGCGCGTG 
CCGTTCTTCT TCGGCGACGC GGGTTACGAG GCCGCGTGGT CCTGGGCCGT GGCGCAGATG 
GCCGCGCTCG GCCACGAGAT CGTCGCGCTC GACTTCGCGC CGCTCGACGA AGTGGCGGCT 
CTGCTCTACG ACGGCCCGTG GGTGGCCGAG CGCCATGCGG TCGTCGCGGC GCTGCTGAGC 
GCGCAACCCG ATGCGCTCGA CGCCACCGTG CGCCGCGTCA TCACGCGCGC CGTCGGCATG 
AGCGCCACCG ACGCCTTCCG CGGCCTCTAT CGCCTGCAGG ACCTGAAGGC GGCGGGGGAG 
GCCACCTGGT CGCGCTGCGA CCTGCTGATG GTGCCGACCG CGCCCGGCCA TCCGCGTTTC 
AGCGAACTCG ATGCCGACCC GGTGGGCGTC AACTCGCTGC TCGGCCGCTA CACCAACTTC 
GTCAACCTGC TGGGCTGGTG CGCGCTGGCG CTGCCGGCCG GGCGCACCGC GGTTGGCCTG 
CCGTTCGGCG TGACCTTCAT CGCGCCGGGC AATCACGACG CCGCACTGGC GCGTTTCGGC 
CTGGGCTGGC AGGCGGCGCA GGGCGTTGCC TCACCGGCGG CGACGCCCGC TCTCTGGCCC 
CAGTCCGAGC CCGAGATGGC GATCGCGGTG GTCGGCGCGC ATCTGTCCGG CCTGCCGCTG 
AACTGGCAGC TGACCGAACG CGGCGCCACG CTGATCGAAG CCACCCGCAC CGCGCCGCGC 
TACCGCCTGC ACGCGCTGCC CGGCACCGTG CCGCCCAAGC CCGGCATGGT GCGCGACAGC 
CTGCGCGGCG GCTCGATCGC GCTCGAGGTC TGGCGCATGC CGCAGCGCGC GGTCGGCAGC 
TTCCTGGCGC TGATCCCGCA GCCGCTCGGC CTGGGCTCGA TCGAGCTGGC CGACGGCCGC 
TGGGTGCACG GTTTCGTCTG CGAGGCCGAA GCCACCGCGC AGGCAAGCGA CATCACCGAG 
CTGGGCGGCT GGCGGGCCTA CCTGCAAGCC GTTGCCGCCG CCCTTCCTGT CCCCCCGAGG 
AGTTGA

Protein sequence

MQYPLLYTSE CTKTVTSTTQ APRTLTQWQE AYRAGAEPAD LLPALRHRLI RGDDPAVIRW 
VTGDELARRL GQLAEVAAAH ADRAALLKVL PLFGVPFAVK DNIDIAGIET TAACPAFAHV 
AGQSAEAVRR LEAAGAVWIA KTNLDQFATG LVGARSPYGR PASVFDAARI SGGSSSGSAV 
LTARGDVAFA LGTDTAGSGR VPAGFNELVG LKPTPGRVST AGVLPACRSL DCVSVFAHSV 
EDAAVVLSVI EGADAADAYS HFAPGPSTWA PRLKVGVPRV PFFFGDAGYE AAWSWAVAQM 
AALGHEIVAL DFAPLDEVAA LLYDGPWVAE RHAVVAALLS AQPDALDATV RRVITRAVGM 
SATDAFRGLY RLQDLKAAGE ATWSRCDLLM VPTAPGHPRF SELDADPVGV NSLLGRYTNF 
VNLLGWCALA LPAGRTAVGL PFGVTFIAPG NHDAALARFG LGWQAAQGVA SPAATPALWP 
QSEPEMAIAV VGAHLSGLPL NWQLTERGAT LIEATRTAPR YRLHALPGTV PPKPGMVRDS 
LRGGSIALEV WRMPQRAVGS FLALIPQPLG LGSIELADGR WVHGFVCEAE ATAQASDITE 
LGGWRAYLQA VAAALPVPPR S