Gene Namu_4891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4891
Symbol
ID	8450521
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5454087
End bp	5455427
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	645043929
Product	hypothetical protein
Protein accession	YP_003204154
Protein GI	258654998
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTTCG CGACCGGACC CGACCCCATG GACCTGCTGA CCCTGCCCTG GTCAACGGCG 
TTGGAACGCT GGCCCAAGGA GAAACTGGTC TCCCTGCCTC GGGGTATCTC TCGGCACGTC 
GTCCGGTTCG TCCGGATCGG CGGCATCGTC TACGCGATCA AGGAGATCAG CCAGGGACTG 
GCCGAGCACG AGTACGGGCT GCTGCGCGAG CTGGCCAAAC GCGAGTTGCC GGTGGTGCAG 
GCGGTCGGCG TGGTGGCCAA CCGGATGACC CCGGAGGGCG AGCCGCTGGA CGCCGCCCTG 
GTCACCAAGC ACCTGAAGTT CTCCCTGCCC TACCGGGCCC TGTTCTCCCG CCGGATGGAC 
CCGGAGCTGG AGACCAAGCT GCTGGACGCA CTGGCCGAGC TGCTGGTCCG GTTGCACCTG 
GTCGGCTTCG CCTGGAAGGA CTGCTCGCTG TCCAACACCC TGTTCCGGCG CGACGCCGGC 
GCCCTGGCCG CCTACCTGGT GGACGCCGAG ACCGGCGAGC TGCGCGAGTC ACTGTCCAAG 
GGGCAGCGCC TGCAGGATCT GGACATCGTG GAGACCAACG TCGCCGGCGA GCTGTTGGAC 
CTGCAGATGT CCGGCCTGCT ACCCGAGTCG ATCGACCCGT TGGAGACCGC GATGTCGGTC 
ATCGAACGGT ACGAGCGGCT CTGGGAGCTG CTCACCGCGC CACAGACCAT GGGCGACGAC 
GAGTGGTGGC GCATCGAGCA GCGGCTGCGC AAGCTCAACG AGCTGGGCTT CGACGTGGCC 
CAGATCCACA TCAACGAGCA CGACGGCGAC CCGCACGTGA TGGTGCAGAC CCAGGTCGTG 
GACGCCGGCC ACCACCGCAA GCGGTTGTTC GCCCTGACCG GCATCAACGT GCAGGAGAAC 
CAGGCCCGGC GCATCCTCAA CGACCTGGAC ACCTACCGGT CGCAGGCCGT CATGCCCGGC 
ACCGAGGTCG ACGAGGACAC CGTGGCCCAC CACTACGTCA CCGACGTCTA CGACCCCGTC 
GTCGAGGCCA TCCCGGCCGG GCTGGCCGAG AAGCTCGAAC CGGCCGAGGT CTTCCACGAG 
GTGCTCGAAC ACCGCTGGTA CCTGACCCAG GCGGCCGAGC GGGAGGTCTC GATGGACTAC 
GCGACCCAGT CCTACATGCA GACCGTGCTG CGCCACCGGC CGGACGAGAA GGCGTTCCTG 
GACTCCAGCC TGATGGGGGT CGGCGCCCTG GACGCCGACG ACATCAGTGA CGACCCGCCC 
GACAGCGATC CGGAAGAGAA CGACCCGGCA GACGTCGACA TGAGTGACGA CGACATGAGT 
GACGACGCGC AGGCCGGCTG A

Protein sequence

MQFATGPDPM DLLTLPWSTA LERWPKEKLV SLPRGISRHV VRFVRIGGIV YAIKEISQGL 
AEHEYGLLRE LAKRELPVVQ AVGVVANRMT PEGEPLDAAL VTKHLKFSLP YRALFSRRMD 
PELETKLLDA LAELLVRLHL VGFAWKDCSL SNTLFRRDAG ALAAYLVDAE TGELRESLSK 
GQRLQDLDIV ETNVAGELLD LQMSGLLPES IDPLETAMSV IERYERLWEL LTAPQTMGDD 
EWWRIEQRLR KLNELGFDVA QIHINEHDGD PHVMVQTQVV DAGHHRKRLF ALTGINVQEN 
QARRILNDLD TYRSQAVMPG TEVDEDTVAH HYVTDVYDPV VEAIPAGLAE KLEPAEVFHE 
VLEHRWYLTQ AAEREVSMDY ATQSYMQTVL RHRPDEKAFL DSSLMGVGAL DADDISDDPP 
DSDPEENDPA DVDMSDDDMS DDAQAG