Gene CPS_4574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4574
Symbol
ID	3520060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	-
Start bp	4827660
End bp	4828871
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	38%
IMG OID	637287014
Product	putative MSHA biogenesis protein MshN
Protein accession	YP_271222
Protein GI	71279601
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTTA TTAATCAGAT GTTAAAGGAT TTAGAACAGC GCAGTCCTGA GTCTAATACC 
GATGCTACTC AGTCAGGTAA TGTTGCAGTA GCCCATTCCC CTATAAAAAT AGCGCTCGTT 
ACTGGGTTTT GTGTGTTAGC CGTTTGTTTT CTTAGTTTTT ATGTTTGGCA ATTAATTAGT 
GAAAATAACG CATTAAAAGC TGAAAAAATA ACGAATAAAG TTAATGCCGT TCAAATGAGT 
TCAGCAAAAA ATAGACCTGA AAATATAAGT AGCCAGATTA ATACGTCTAA GCAAATAAGC 
AGCAACGAAA ATACCGTTCA GAATGATCCA ATAAACGTAC ATGTCACTAA AATTTATGAT 
CAACAGGAAA TAGCACCTAT AAATGGTCAA ATTGCTGAAC CAACAGATGT AAATAAAGTA 
TTATCAAATA ACAGTGCTGA GACTACTGCC AAGTTAATAA CGGCAAAACC TTTGGTAAAT 
AACAGCGCTA GCCAAGTAAC ACCAGTAAAG AAAGCGAAAG TTATAGCGGA TACCCATAGT 
CATTCGGGAG ATAGTTCAGG TCATAGCCAC GACATTGTTG ATATCGTCAA AGCTAAACCT 
AAGCCAAAAG TAAATAAAAT GTCGGTGTCA CGACGTCAAT TATCGGCGGA TGAACTAGCA 
GAGCAAAAAT TAGTCCTCGC TGAAAAAGCA CTAGCGGCTA AGCAAATCGA GAAGGCCGAA 
AAACTACTAG AAGATGTAGT CATTATCAGG CCGAGCGATA GTCAAACACG TAAAAAACTG 
GCGGCTTTAT GGTTTGGCCG TCAAGCTTAT CAAGATGCTG TGAATTTATT GTCACAAGGC 
ATCGCCTTAA ATGGTAAAGA CAGCAGTTTA CGTCAAATGA AAGCGCGCAT TCATTTAAAG 
CAAGGGCAAT TCACGGCTGC GCTGAATACG TTAAAACCTC TTGCTCAATT AAAAGATGAG 
CAATATCAAG TCATGCTGGC AAATACCGCA CAGCAAGCCA AACAAAATAA AATAGCCGTT 
GATGCGTATA AAATGTTAAT AGCAATGAAA CCGGATATAG GCCGTTGGCC GCTAGGTTTA 
GCCGTTTTGT ACGATAAAAA CAGCCAGTTT GAGTTGGCCA GTATGGCTTA TAAAAAAGCA 
TTAACAAAAA ATGATTTATC AGTTTCTTCA GAAAACTTTG TTAAGCAACG CTTACAAGTA 
ATAGGACAGT AG

Protein sequence

MSVINQMLKD LEQRSPESNT DATQSGNVAV AHSPIKIALV TGFCVLAVCF LSFYVWQLIS 
ENNALKAEKI TNKVNAVQMS SAKNRPENIS SQINTSKQIS SNENTVQNDP INVHVTKIYD 
QQEIAPINGQ IAEPTDVNKV LSNNSAETTA KLITAKPLVN NSASQVTPVK KAKVIADTHS 
HSGDSSGHSH DIVDIVKAKP KPKVNKMSVS RRQLSADELA EQKLVLAEKA LAAKQIEKAE 
KLLEDVVIIR PSDSQTRKKL AALWFGRQAY QDAVNLLSQG IALNGKDSSL RQMKARIHLK 
QGQFTAALNT LKPLAQLKDE QYQVMLANTA QQAKQNKIAV DAYKMLIAMK PDIGRWPLGL 
AVLYDKNSQF ELASMAYKKA LTKNDLSVSS ENFVKQRLQV IGQ