Gene Namu_3075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3075
Symbol
ID	8448689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3391379
End bp	3392650
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	73%
IMG OID	645042157
Product	tryptophan synthase subunit beta
Protein accession	YP_003202398
Protein GI	258653242
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000212067
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000123729
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTGTGC CCGCGCGAGC GGCCGTCGAT CTGCCACGCC CGTCCGACGG GCTGGCCGGC 
ACCGACCACG ATCCCGACGA CCGCGGCTAC TTCGGCACCA TGGGCGGCCG GTGGTTGCCC 
GAGGCCCTGG TCGGGGCCCT GGACGAGGTC GCCGACTACT ACCGCAAGGC CCGCCGGGAC 
CCCGATTTCC TGGCCCGGCT GGACGACCTG GCGGCCAACT ACGCCGGCCG CCCGAGCCCG 
CTGTCCGACG CCCCCCGGCT GACCGCCGAG GTCGGCGGCG CTCGGATCCT GCTCAAGCGC 
GAGGACCTGA ACCACACCGG CAGCCACAAG ATCAACAACG TGCTCGGGCA GGCCTTGCTG 
GCCCAGCGCA TGGGCAAGAC CCGGCTGATC GCCGAGACCG GGGCCGGCCA GCACGGGGTG 
GCCACCGCCA CCGCCGCGGC CCTGCTCGGC CTGGAGTGCT GCATCTACAT GGGCCGGGTC 
GACACCGAAC GGCAGGCCCT GAACGTGGCC CGGATGCGGC TGCTGGGCGC CGAGGTCGTC 
GCCGTCGAGG CCGGCTCGGC CACCCTCAAG GACGCCATCA ACGAGGCGTT CCGGGACTGG 
GTGGCCACCG TCGACCACAC CTTCTACCTG TTCGGCACGG TGGCCGGCCC GCATCCGTTC 
CCGGTGATCG TCCGCGACTT CCAGCGGATC ATCGGCCTGG AGGCCCGGGC CCAGGTGCTC 
GACCGCACCG GCCGGTTGCC CGACGCGGTC GCCGCCTGCG TCGGCGGCGG CTCCAACGCG 
ATGGGCATCT TCCACGCCTT CCTGGACGAC CCGGACGTGC GGCTGGTCGG CCTGGAGGCC 
GGCGGCGACG GCATCGAGAC CGGACGGCAC GCCTCCACCA TCAGCGGCGG CTCGGTCGGG 
GTGCTGCACG GCGCCCGCTC CTTCCTGCTG CAGGACGCCG ACGGCCAGAT CATCGAGTCG 
CACTCGATCA GCGCCGGACT GGACTACCCC GGCGTCGGCC CCGAGCACTC GCACCTGGCC 
GAGATCGGCC GGGCCGAGTA CCGCTCGATC ACCGACACCC AGGCCATGGA TGCGTTCGCG 
CTGCTGGCCC GGACCGAGGG CATCATCCCG GCCATCGAGT CCGCGCACGC CGTGGCCGGG 
GCGCTGGACC TGGCCCGGGA GATCGGCCCC GAGGGCATCG TGTTGATCAA CGTCTCCGGC 
CGGGGGGACA AGGACATGGA GACGGCCATG CAGTGGTTCA AGCTGGCCGA ACCGACGGGA 
GCCGTCCAGT GA

Protein sequence

MSVPARAAVD LPRPSDGLAG TDHDPDDRGY FGTMGGRWLP EALVGALDEV ADYYRKARRD 
PDFLARLDDL AANYAGRPSP LSDAPRLTAE VGGARILLKR EDLNHTGSHK INNVLGQALL 
AQRMGKTRLI AETGAGQHGV ATATAAALLG LECCIYMGRV DTERQALNVA RMRLLGAEVV 
AVEAGSATLK DAINEAFRDW VATVDHTFYL FGTVAGPHPF PVIVRDFQRI IGLEARAQVL 
DRTGRLPDAV AACVGGGSNA MGIFHAFLDD PDVRLVGLEA GGDGIETGRH ASTISGGSVG 
VLHGARSFLL QDADGQIIES HSISAGLDYP GVGPEHSHLA EIGRAEYRSI TDTQAMDAFA 
LLARTEGIIP AIESAHAVAG ALDLAREIGP EGIVLINVSG RGDKDMETAM QWFKLAEPTG 
AVQ