Gene Tbd_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_0040
Symbol
ID	3673247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	+
Start bp	40581
End bp	42122
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	68%
IMG OID	637708699
Product	hypothetical protein
Protein accession	YP_313798
Protein GI	74316058
COG category	[R] General function prediction only
COG ID	[COG4784] Putative Zn-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.257159
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAAAG CGGCTTCGGC CGCTTTTTGC ATTGTTGCGG CAAGCCAGCG TTTATCATTG 
CGTTCCGGAC GAATAGATGA GGCAGATGTG ACACCCCGAG GGGCTTTCCG CCGTATTGCC 
ATGATCCTGG CCGGCGCGCT GGCGCTGAGT CATTGCGCGC AGAATCCCGT GAGCGGCGAG 
CGCGACTTCG TGCTGCTGTC CGAGCAGCAG GAAGCCGAAA TGGGCGCGCA GGCGCATCGC 
GACGTGCTGA AGGAATACGC GGCGCTCGAC GCGCCCGAAC TGCAGGCCTA TGTCGACGCG 
GTCGGCCAGC GTCTCGCGAA GCAAAGCCAT CGCCCGGGGC TGACCTGGCA CTTCACGGTC 
ATCGACAGCC CCGACGTCAA CGCCTTCGCA TTGCCCGGCG GCTATGTGTA CGTCACACGC 
GGCATCCTGG CCTATCTGAA TTCGGAAGCC GAACTTGCCG GCGTCGTCGG CCACGAGATC 
GGCCACGTCA CCGCGCGCCA CGGCGTGCGC CAGCAAAGCG CCGCCACGGC CGCCGGCCTC 
GGCACCGTGC TCGGATCGAT CCTCGTGCCG GGACTGGACA ACCAGGCGGG CGCCTCACTG 
TTGCAGACGC TCGCGCAGGC CTGGACCGCC GGGTATGGCC GCGAACACGA ACTCGAGGCC 
GACCGGCTCG GCGCGCAATA CCTCGCGAAA ACCGGCTACC GGCCCGAGGC GATGATTGAC 
GTCATCGGCG TGCTCAAGAA CCAGGAACGC TTTGCCGCCG AGAGGGCCAA GCGTGACGGC 
ACCAAGCCGC GCACCTACCA CGGCACCTTC GATACGCACC CGAGCAACGA CAAGCGTCTG 
CAGCAGGTGG TGAACGAGGC GAAGCGCTAT CGGGTCGCGG CGCCGCGCGA GGGGCGCAGC 
GAGTATCTCG AGAAGATCGC CGGCGTCTAC TTCGGCGACA GCCCCGAGCA GGGGCTCGTC 
CGCGACAACC TGCTGGTGCA CGAGAAACTC GGCCTGGCGA TGCAATTTCC GCCCGCGTGG 
CATGTGCAGA ACCATCCCGA CCGGGTGGCA GCGACGAGCC CCGGCGGCGA CGCGATGATC 
GAGATCCTGG CCGGGCCGCG GAACGCGCGA CCGCTCGACA CGCTGAAGAA GGGCATCCGG 
CTCGATCCCG GCGCGCGCTA CGACAGCGGC AACCTCGGCG GCTTCCCCGC GGCGTTTGCC 
GCCGGTGCCC AGCAGGGTAG GCCGGTCGTC GTCGCCGCCG TGGTGTTCAA GGACAGGCAG 
TACCTGATCG CCGGCATGAC GCGGGACAAA ACCGCCTACC AGAAGCAACG CGGTACCCTG 
CGCGCGGCGA TCAACAGCTT CCGCGAGACG ACCGGCGCCG ACAGGGCGCG TGCGCGTCCC 
TATCGCCTGA AGCTCGTGAC GGCCAAGCAC GGCACGACGA TGGCCGAAGT CGCGCGGCAG 
AGTCCGCTCG GCGCCGACGG CGAGAGCCAG TTGCGCCTCA TGAACGACCT CTATCCCGGC 
GGCGAGCCCA AGGCGGGCCA GCGCCTCAAA GTTGTCGACT GA

Protein sequence

MLKAASAAFC IVAASQRLSL RSGRIDEADV TPRGAFRRIA MILAGALALS HCAQNPVSGE 
RDFVLLSEQQ EAEMGAQAHR DVLKEYAALD APELQAYVDA VGQRLAKQSH RPGLTWHFTV 
IDSPDVNAFA LPGGYVYVTR GILAYLNSEA ELAGVVGHEI GHVTARHGVR QQSAATAAGL 
GTVLGSILVP GLDNQAGASL LQTLAQAWTA GYGREHELEA DRLGAQYLAK TGYRPEAMID 
VIGVLKNQER FAAERAKRDG TKPRTYHGTF DTHPSNDKRL QQVVNEAKRY RVAAPREGRS 
EYLEKIAGVY FGDSPEQGLV RDNLLVHEKL GLAMQFPPAW HVQNHPDRVA ATSPGGDAMI 
EILAGPRNAR PLDTLKKGIR LDPGARYDSG NLGGFPAAFA AGAQQGRPVV VAAVVFKDRQ 
YLIAGMTRDK TAYQKQRGTL RAAINSFRET TGADRARARP YRLKLVTAKH GTTMAEVARQ 
SPLGADGESQ LRLMNDLYPG GEPKAGQRLK VVD