Gene Namu_3484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3484
Symbol
ID	8449103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3831362
End bp	3832591
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	63%
IMG OID	645042562
Product	putative tail protein from prophage; putative tail length tape measure motif protein
Protein accession	YP_003202798
Protein GI	258653642
COG category	[S] Function unknown
COG ID	[COG5280] Phage-related minor tail protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0174075
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00423679
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGTACG AAGTCGGTGT AGGCGTTCTG AGCATCATTC CGTCGCTCAA GGGCTTCGAC 
GCGGCGATGG ACAAGCAACT GTTCAAGCCG CTGAACAAGG CCTCGGATCA GTCCGGCTCG 
GATTCCGGCG GATCCTTCCT CGGTGGATTC AAGGGCGCCG CGATGGCTGG CATTGCCGGC 
ATTGCGGCTG CGGTCGGTGC GGCGTTCGTG GACTCGTACA CCGAGGCCCT GGACGTGCGG 
AAGATGCAGG CGAAAGCTCA AGCCTCGCTT GGGTTGACGG CGGATCAGGC GAAGAACCTG 
GGGAAGTCGG CGGGCAATCT GTACGCGCAG GGGTACGGCG ACTCGATCAG TGAGCTGACC 
GACTCGGTCG CCTCGGTGCA ATCGGCGTTC CAGAACCTCA AGCTTCCCGA CTCCCAGTTG 
GAGCGACTGA CCGGGAAAGC ACTGTCGTTC TCGCAGGCGT TCGGCGGCGA CGTCGAGACC 
GTGTCGCAGA ACGTGAACAC CCTGCTCGGT TCCGGTCTGG TCAAGAGTGC AGACGAGGCG 
TTCGACCTGT TGACCAAGTC CTCCCAGAAG GTGCCGGCTG CGCTGCGGGG TGATATCTCC 
GACGCCTCCG ATGAGTACTC GCAGTTCTTC CGCACCTTAG GTTTTTCCGG GGATCAGGCT 
TTCGACGCCC TGGTGAAGGG CGCCGACAAG GGCACTTTCG GAATTGACAA GACCGGCGAC 
GCGATCAAGG AATTCACGAT CCGATCCACC GACATGAGCG CATCGTCGGT CGGTGCATTC 
CAGGCGATCG GCCTGGACGC GCAGACCATG GCGAACAAGA TCCTCGCCGG TGGGGACGAC 
GCGAAGGGTG CGTTCGACCA GATCACCGAC GGGATCTTGG CGATCCAGGA CCCGGCCGCG 
CAGTCTCAGG CCGCGCTGGC CCTGTTCGGG ACGCCGCTGG AAGACATGAA CGTGCAGGAC 
ATCCCGGAGT TCCTCAAGGG CCTCAAGGGC ATGTCGGGCG GGATGGGCGA CGCCGCGGGT 
GCCGCCGACG CCATGGACCA GGCAATGGGT TCGACCACCA GCGGGATCGA GCTGCTGTGG 
CGGAACCTGA AATCGAACCT CGTCGGGTTC ATCACCGATC AAGTGATCCC CGCGGTCAGC 
GAGTTCACGT CATGGCTCGC GGAGAAGTTG ACGCCGGTCA TCAGTGAGGT TGTCGCCTGG 
CTGGGCGAGC ACCTCGGACC GGTGATCTGA

Protein sequence

MAYEVGVGVL SIIPSLKGFD AAMDKQLFKP LNKASDQSGS DSGGSFLGGF KGAAMAGIAG 
IAAAVGAAFV DSYTEALDVR KMQAKAQASL GLTADQAKNL GKSAGNLYAQ GYGDSISELT 
DSVASVQSAF QNLKLPDSQL ERLTGKALSF SQAFGGDVET VSQNVNTLLG SGLVKSADEA 
FDLLTKSSQK VPAALRGDIS DASDEYSQFF RTLGFSGDQA FDALVKGADK GTFGIDKTGD 
AIKEFTIRST DMSASSVGAF QAIGLDAQTM ANKILAGGDD AKGAFDQITD GILAIQDPAA 
QSQAALALFG TPLEDMNVQD IPEFLKGLKG MSGGMGDAAG AADAMDQAMG STTSGIELLW 
RNLKSNLVGF ITDQVIPAVS EFTSWLAEKL TPVISEVVAW LGEHLGPVI