Gene Noca_1541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1541
Symbol
ID	4595481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1634291
End bp	1635604
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	67%
IMG OID	639776140
Product	type II secretion system protein E
Protein accession	YP_922742
Protein GI	119715777
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACC TCGACTACGC ACTGATCAAG CGGCTGCAAG GCGAACTCGG TCGGCTCCGA 
CAGGAGGAGA TCCTGCGGCG GCGGAGCGCC AACCTCCCAG CGCTCACCGG TCCCGACGCG 
GTCCAGCACG GCAAGGCGCT GGTCCAAACG GTTGTCGGAG ACTACGAGTC GAACCTCGTC 
GAGACAGGTT CCGAGCCCAT CACGTGGGAA GCGCGGCAGG ATCTCGTCGA AGCGCTGGAG 
TCCCGTCTCT TCGGAGCGGG CAGCCTGCAG GCACTACTCG ACGACGCGAA CGTCGAGAAC 
ATCGACATCA ACGGCTTCCA ACACGTGTAC GTCGAGTACG CCGACGGCAC TACCGCGAAG 
GTGCGACCGA TCGCCGGATC GGACGAGGAG CTCGTCGAGA CCGTCCAGAC GCTCGCGGCA 
CACGAGGGGC TCTCGGCTCG GGCCTTCGAC GTCGCCAACG TTCGCGTGAA TCTCCGGCTC 
CCGGATGGTT CGCGCCTCTA TGCCGTCCAG TCGGTGACGA AGCAGCCGGT CGTCTCGATC 
CGACGCCACC GCCACCCTCG CGTGACTCTC AAGGACCTGA TCGGCCTGGA GACGATCGAC 
GAGGAGATGG CCGACTTCTT GGCAGCACTG GTCAGAGCCC GCAAGAACGT CATGGTCGCC 
GGGGCCACCA GCGCGGGGAA GACGACCATG CTCCGGGCAC TTGCTTCCGA GATCGGTCCG 
GACGAACGCA TCCTCACAGT CGAGCGTTCG CTCGAGCTCG GCCTCGACGA GGATCTGGAA 
CACCACCCCA ACGCGATCGC GTTCGAGGAG CGCCTGCCGA ACGTCGAAGG GGCCGGCGCC 
GTCACGATGG CCGAGTTGGT CCGCGACACC CTTCGCATGA ATCCCTCCCG CGTGATCGTC 
GGGGAGGTCC TCGGCGACGA GGTCGTCACG ATGCTCAACG CGATGACCCA GGGCAACGAC 
GGCTCGCTGT CCACGATCCA CGCGAATTCG TCCTCCGACG TCGTCCACAA GATTGCGACG 
TACGCCATCC AGGCGCCCGA ACGACTGCCT TGGGAGGCGA CCGTACGGCT GGTCGCGACG 
GCGCTGGACT TCGTGGTGTT CATCCGTCGG GTGCGCGGCG AGGACGGGCA GCGACGGGTC 
GTCGAGTCGA TCCGCGAGAT CGCCGGGATC AGCGACGACG GCCAGCTCCA GACCAACGAG 
CTGTGGGCAC CGGATTCGTT CGGCAACGTC GTACGACGCC ACGGCGTCCA GGTGCGAGCC 
CACGACGACC TGGTGGCGGT GGGTTGGCAG CCGGAGCCGG GTGGGTGGTC GTGA

Protein sequence

MTDLDYALIK RLQGELGRLR QEEILRRRSA NLPALTGPDA VQHGKALVQT VVGDYESNLV 
ETGSEPITWE ARQDLVEALE SRLFGAGSLQ ALLDDANVEN IDINGFQHVY VEYADGTTAK 
VRPIAGSDEE LVETVQTLAA HEGLSARAFD VANVRVNLRL PDGSRLYAVQ SVTKQPVVSI 
RRHRHPRVTL KDLIGLETID EEMADFLAAL VRARKNVMVA GATSAGKTTM LRALASEIGP 
DERILTVERS LELGLDEDLE HHPNAIAFEE RLPNVEGAGA VTMAELVRDT LRMNPSRVIV 
GEVLGDEVVT MLNAMTQGND GSLSTIHANS SSDVVHKIAT YAIQAPERLP WEATVRLVAT 
ALDFVVFIRR VRGEDGQRRV VESIREIAGI SDDGQLQTNE LWAPDSFGNV VRRHGVQVRA 
HDDLVAVGWQ PEPGGWS