Gene Namu_3850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3850
Symbol
ID	8449469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4221542
End bp	4222501
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	71%
IMG OID	645042899
Product	Glycosyl hydrolase family 32 domain protein
Protein accession	YP_003203135
Protein GI	258653979
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0183549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.803751
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCCGAC TTCCCGATTC CTGGTTGTGG GACTTCTGGC TCGCCCGTGA CGAGCAGACG 
TACCACCTGT TCTTCCTGTA TGCCTCGCGA GCGCTGCACG AGCCCGACCG CCGGCACCTG 
CGGGCCGCGG TCGGCCACGC GGTGTCCACC GACCTGGTCC ACTGGGAACG GGTCGCCGAC 
GCCATCGTCC GCGACGACGC ACCGGCTTTC GACCACACCG CGACCTGGAC CGGGTCGGTG 
GTCCGTGGAC CCGACGGCAG CTGGTCGATG TTCTACACCG GCACCGTCCG CCACGAGGAC 
GGGACGCTGC ACCAGCAGGT CGGCCGGGCG GTATCCACCG ACCTGTACCA CTGGCTGAAG 
GATCCGCGAA ACCCGTTGGT CAGAGCCGAC TCCCGCTGGT ACGAGACGCT CGGCGGGGCA 
GCCCCGTGGG CGGACGAGCA CTGGCGCGAC CCGTGGGTCT TCGCCGACCC GGACGGCGAC 
GGCTGGCACA TGCTGATCAC CGGCCGGGCC AACCACGGAC CGCTGGACGA GCGTGGTGTC 
GTCGCCCACG CCCGCTCGGC CGATCTGGCC GACTGGCAGG TCGGCCCCCC GCTGTCCGGC 
CCGGACGGCG GGTTCGGGCA GATGGAGGTC TTCCAGGTCG AGAACGTCGA CGGCCGTTGG 
GTGCTGATCT TCAACTGCCT GGACGGGGAG TTCTCGGCGG CCCGGGCCCG GGCCGGCGGG 
CCCGGCGGGA TCTGGGTGGC CGGCGCCGCG TCCGCGTTGG GCCCCTACGA CATCGCCGGG 
GCCACCCTGC TCTCGGACGA TCGTTACTAC GTCGGCAAGC TGGTTCGGGA TCCCGACGGG 
CACTGGGTGT TGCTGGCCTT CGTCAACAAG GACGAGAACG GCGCGTTCGT CGGGGATCTG 
AGCGACCCGA TGCCGGTCGG CTGGGACGCC GACCGGCTGG TGCTGCGGCC CGCCGGGTAG

Protein sequence

MFRLPDSWLW DFWLARDEQT YHLFFLYASR ALHEPDRRHL RAAVGHAVST DLVHWERVAD 
AIVRDDAPAF DHTATWTGSV VRGPDGSWSM FYTGTVRHED GTLHQQVGRA VSTDLYHWLK 
DPRNPLVRAD SRWYETLGGA APWADEHWRD PWVFADPDGD GWHMLITGRA NHGPLDERGV 
VAHARSADLA DWQVGPPLSG PDGGFGQMEV FQVENVDGRW VLIFNCLDGE FSAARARAGG 
PGGIWVAGAA SALGPYDIAG ATLLSDDRYY VGKLVRDPDG HWVLLAFVNK DENGAFVGDL 
SDPMPVGWDA DRLVLRPAG