Gene Tbis_0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_0414
Symbol
ID	9166895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	+
Start bp	463890
End bp	466301
Gene Length	2412 bp
Protein Length	803 aa
Translation table	11
GC content	70%
IMG OID
Product	NHL repeat containing protein
Protein accession	YP_003651035
Protein GI	296268403
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.316951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.387155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGC GCCCGGCCGC GGCGTTCGCC GCGGCGCTCT TACTCGCGGT GGCGGCGGGC 
CTGGTCCGGC CCGCCGCCGA GGCCGGCGCG GCCACCGTGC TCACCTTCGC CGACGAGGAC 
CGCTCGTCCG AGCTGACCGG GCACGTCGTC CACCAGCGGT ACCAGTTCAA CACGCCCACC 
ACGGTCACCT ACGACCGGGA CACCATCACC GGCAACCCCG CCGCGGCCCG GGTCTACGTG 
GCCGACATGG GCAACCACGT GATCCGCGTC TTCGACCTCA ACGGCAAGCA GATCGGCCGG 
CTCGACGACG CGGACACCCA GCTGGCCCCG GACAGCCCGG CGAGCTCGGT GCCGCAGATC 
ACCGCGCCGC TCGGCATCTA CTTCCTCTCC AAGAGCGAGG CCGTCGACGA CCGGCTGGCC 
GGGCTCTACA TCAACGACGT CGGCGTGCAC AAGCTGCACT TCTTCCGCAC CGACCCGTCC 
AACCCGGACC GGTTCTACTA CGTGACCTCC TTCGGCCAGG AGGGCCACGG CGGCGGCGCC 
GACCTGAAGC TGCCGCGGAA CATGACGGTC ACCCCGGACG GCCTGCTGTA CGTCTCCGAC 
GAGTTCAACC ACCGGATCAA GGGCTTCCGG ATCGACCCGG ACACCTGGAC CGCGACCCTC 
GTCACCACGG TCGGCTCCCA GGGCGGCCCC ATCATCCCCG GCACGGACAA GGACTACGGC 
ACCGACTCCA CCCACTACGA CGACTACGCG GGCGAGCCGC TCAAGCGGGA CGGCTTCCGC 
ATCCCGCAGG GCATGACCTA CTGGCGGACG CCGGACGGCT CCCGCACCTA CCTCTACGTC 
GCCGACAACG GCAACAACCG CGTCAAGATC TTCGAGGTCG CGGCGAGCGG CACGCTCACC 
CTCGTCGACA TCCTCGGCCG GTTCACGCGG AACGGCACCG CCGACCACCT CAAGCGCCCC 
CGCGGCGTCC GGGTCGACGT GAACGGCAAC CTCTACGTCG CCGACACCTA CGGCGGCCGG 
ATCATCCGCT TCCCGAACCT CGGCACCAAC ACCGCCAAGT ACCGCACCTC GCTCAGCGCG 
GACGCCGCCG CCTCCTGGGT GTACGGCCGG CTCGGCATCC ACCAGGTGGA GATGCGCACC 
CCCGCCACCG CGCTCACCGA GGACGAGGCG TTCCAGCTCC CCAACGACGT GGTCCCGGTG 
GAGACCCCGA GCGGCGCCCG GTACACCGAG AACATCTGGT CGTGGGGCGT CTACTACCCC 
GGCGCGCGGG TGCTGCTGGT GAGCGACACC GGCAACCACC GGATCAAGAA GTGCTGGGAG 
CACCCCACCC AGAACACGAT CCTCCGTTGC TCGGTCTCGG CCGGCGTCGG CGGGGTCACC 
GCCCACGAGT TCTGGGGCCA CCCGCGCACG CTCGCCGGCC AGCTCCACGC GGTGGGCGGC 
ATGGACCTGC TGCCCGGGCA GGGGAGCGAC CCCGACACCC TGCTCGTCAG CGACACCCCC 
AACACCGTCA TCTACCGCTA CGGGCTCGAC GGGTCGTACA AGGGCAAGTT CACCGGCGGC 
TCGATCTCGT ACGGGGTCAC CGGGCTGAGC GTCTACCCGG TCTCCGGGAG CCACCACGTC 
GGCGTGCTCG TCGCCGCCGA CGCGACCCTG CCCTACCCGT ACACCGGGGA CAGCTCGCTG 
CGCATCTACA ACCGCGCCGG CGGCTCCGTC AACGTCTTCA ACCTCACCAC CCGCACCTCC 
GGCGCCTCGA AGATCAGCTA CACCGGCGGG AACTTCCCGG TGGCGATCGA CATCGTGCCG 
GAGGGCGGCT CGTACGGGGT GTTCATCAGC ACCTCCGGCA ACCGGCTCTA CCGGTTCACC 
CTGAGCGGCT CCTCGCTCAC GCTCAACTGG GTGACCGGCG GCCCCGACCC CAGCAAGGGG 
TCCGACTCCG GCTCGACCTG GAACCTCGGC CCGAACTTCT ACGGCGAGGG CGCGGCCGGC 
ACGTTCGACC AGATCCAGGA CGTCACCGCC GGCGGCGGCC GGGTCTACGC GGTGGACCGG 
CGCAACCAGC GGATCCAGGT CTTCAACGCC TCCACCGGCG CCTACATCGC CAAGATCGGC 
AAGGGTGGCG GCACCTACGA CCACCCGGCG TCGATCACCC CCGACGAGTT CTTCCTCCCG 
CACGGCGTGC GGCTCGACGG CGGCCTGCTG GTCGGCGACG GGTTCAACAT GATCGTCCGC 
GACTACGACG ACCCGACCGG GCTGACGCCC GACTCCTCCG GCCGGCTGCC GGTGACCATG 
CGCGGCTACT GGGTCGACCC GCACCTCGGC ACCCGCAAGG GCGGCCTGTT CGCCACCCAG 
CACGTGCTGC GCGCCGGGCC GTACGTGTTC GTGGACTCCC TGATCTCGAA TCGCATCACC 
CGGATCTCAT AG

Protein sequence

MRKRPAAAFA AALLLAVAAG LVRPAAEAGA ATVLTFADED RSSELTGHVV HQRYQFNTPT 
TVTYDRDTIT GNPAAARVYV ADMGNHVIRV FDLNGKQIGR LDDADTQLAP DSPASSVPQI 
TAPLGIYFLS KSEAVDDRLA GLYINDVGVH KLHFFRTDPS NPDRFYYVTS FGQEGHGGGA 
DLKLPRNMTV TPDGLLYVSD EFNHRIKGFR IDPDTWTATL VTTVGSQGGP IIPGTDKDYG 
TDSTHYDDYA GEPLKRDGFR IPQGMTYWRT PDGSRTYLYV ADNGNNRVKI FEVAASGTLT 
LVDILGRFTR NGTADHLKRP RGVRVDVNGN LYVADTYGGR IIRFPNLGTN TAKYRTSLSA 
DAAASWVYGR LGIHQVEMRT PATALTEDEA FQLPNDVVPV ETPSGARYTE NIWSWGVYYP 
GARVLLVSDT GNHRIKKCWE HPTQNTILRC SVSAGVGGVT AHEFWGHPRT LAGQLHAVGG 
MDLLPGQGSD PDTLLVSDTP NTVIYRYGLD GSYKGKFTGG SISYGVTGLS VYPVSGSHHV 
GVLVAADATL PYPYTGDSSL RIYNRAGGSV NVFNLTTRTS GASKISYTGG NFPVAIDIVP 
EGGSYGVFIS TSGNRLYRFT LSGSSLTLNW VTGGPDPSKG SDSGSTWNLG PNFYGEGAAG 
TFDQIQDVTA GGGRVYAVDR RNQRIQVFNA STGAYIAKIG KGGGTYDHPA SITPDEFFLP 
HGVRLDGGLL VGDGFNMIVR DYDDPTGLTP DSSGRLPVTM RGYWVDPHLG TRKGGLFATQ 
HVLRAGPYVF VDSLISNRIT RIS