Gene Lcho_3644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lcho_3644
Symbol
ID	6162681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Leptothrix cholodnii SP-6
Kingdom	Bacteria
Replicon accession	NC_010524
Strand	+
Start bp	4069991
End bp	4071028
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	641666417
Product	biotin synthase
Protein accession	YP_001792663
Protein GI	171060314
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGG CCACCATCTC CCTGTCCACC CTGCAAGCGT CGCGCCCCAG CGTGGCGGCG 
CGCGCCGATG CGGCGGCGCG CTGGCGCGTG GCCGACGTCG AGGCGCTCTA CGCGCTGCCC 
TTCATGGACC TGCTGTTCCA GGCCCAGCAG GTGCACCGCG CCCACTTCGA CGCCAACGAG 
GTGCAGCTGT CGACGCTGCT GTCGATCAAG ACCGGCGGCT GCGCCGAAGA CTGCGGCTAC 
TGCCCGCAGT CGGCCCACTT CGACACCGCC GTCGAGGCCA GCAAGCTGAT GCCGATCGAC 
GAGGTGCTCG ATGCCGCCAA CGCCGCCAAG GCGCAGGGCG CGACCCGCTT CTGCATGGGT 
GCCGCCTGGC GCAGCCCGAA GGAGCGCGAC ATGGAACGCG TGACCGAGAT GGTGCGCGAG 
GTGCGTGCGC TGGGCCTGGA GACCTGCATG ACGCTGGGCA TGCTCGACGG CGAACAGGCG 
CGTGAACTCA AGGACGCCGG CCTCGACTAC TACAACCACA ACCTCGACAG CGCGCCCGAT 
TTCTACGGCC AGGTCATCAG CACCCGCACC TATCAGGACC GCCTCGACAC GCTCGGCAAC 
GTGCGCGACG CCGGCATCAA CGTCTGCTGC GGCGGCATCG TCGGCATGGG TGAAAGCCGC 
ACCCAGCGCG CCGGGCTGAT CGCGCAGCTG GCGAACCTGT CGCCGTATCC GGAGTCGGTG 
CCGATCAACA ACCTGGTGCC GGTGCCGGGC ACGCCGCTGG CCGATGCCGA GCCGATCGAC 
CCGTTCGAGT TCGTGCGCAC GATCGCGGTG GCGCGCATCA CGATGCCGAC CACGATGGTG 
CGGCTGTCGG CCGGGCGCGA GCAGATGGAC GAAGCGCTGC AGGCGCTGTG CTTCGCCGCC 
GGCGCCAACT CGATCTTCTA CGGCGACAAG CTGCTGACCA CGAGCAACCC GCAGGCCGCC 
CGCGACCGCG CGCTCTTCGA GCGCCTGGGC CTGCGCGTGC AGGGCGAGCG CCCGGCCGTG 
CGTACATCGG ACAACTGA

Protein sequence

MTTATISLST LQASRPSVAA RADAAARWRV ADVEALYALP FMDLLFQAQQ VHRAHFDANE 
VQLSTLLSIK TGGCAEDCGY CPQSAHFDTA VEASKLMPID EVLDAANAAK AQGATRFCMG 
AAWRSPKERD MERVTEMVRE VRALGLETCM TLGMLDGEQA RELKDAGLDY YNHNLDSAPD 
FYGQVISTRT YQDRLDTLGN VRDAGINVCC GGIVGMGESR TQRAGLIAQL ANLSPYPESV 
PINNLVPVPG TPLADAEPID PFEFVRTIAV ARITMPTTMV RLSAGREQMD EALQALCFAA 
GANSIFYGDK LLTTSNPQAA RDRALFERLG LRVQGERPAV RTSDN