Gene Noca_1128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1128
Symbol
ID	4599381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1195424
End bp	1197115
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	71%
IMG OID	639775724
Product	type II secretion system protein E
Protein accession	YP_922331
Protein GI	119715366
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02533] general secretory pathway protein E

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTGC GCGCACAGAC CTCCGGAGAC ACCGTGCGTG CCCTGGTCGA GGGCGGCTGG 
ATCACCCGCG ACCAGCTCAG CGAGGCGGGC CGGCTCGCGG ACGAGCGGTC CCAGACCGTG 
CTCGAGGTGC TGCTCGAGAG CGGCTGGGTG GACCGCACCA CGGTCGTGCG CACCGCAGCC 
GCCTCGGCCG GCCTGGAGTA CGTCGAGCTC ACCGACTTCA TCGTCGACAT GGCGGCCGTG 
AGCCTGCTGC CGGCGGAGTT CGCCCGCCGC ACCGGCGTAC TGCCGCTGGT CCACGAGGAC 
GGCGAGCTGC TGGTGGCCGT GAGCGTGCGC CAGGCGGGCG ACATCGAGCT CAAGGACGAC 
CTGAGCCGGC TGACCCGCAG CCGGGTCCGC TTCGCGATCG CCGGCCGCAG CGACATCGAC 
GCCCGGATCA ACCAGGTCTA CCGCGCCGAG GGCGAGCTCA CCGACATCAC CTCCGACCTG 
GCGCCCGAGG ACGAGGTCGA CGACCTCAGT ACCCTCACCG AGGTCTCCGA CGAGGCGCCG 
GTGGTCCGCT TCGTCAACCT GCTGATCAAC CAGGCGATCA ACGACCGCGC CTCGGACATC 
CACATCGAGC CGACCGAGCG GGACATGCGG GTCCGGTACC GGATCGACGG GGTGCTCCAC 
GACGCCCACC GCTCCCCGAA GAGCATCCAG AACGGGGTGA TCTCGCGCCT CAAGATCATG 
GCCGAGATGA ACATCGCCGA GCGTCGGGTG CCGCAGGACG GCCGGATGTC GGTCACCCAC 
CAGGGCCGGC GCATCGACCT CCGCGTCGCC ACCCTCCCGA CCGTGTGGGG CGAGAAGGTG 
GTCGCCCGGA TCCTGGACAC CTCCAACACC CAGCTCGGCC TCGACGACCT GGGGTTCAGC 
AACGAGAACT ACGAGCGCTA CCGGGCCTCG TACACCAAGC CCTACGGGAT GATCCTGGCG 
ACCGGGCCGA CCGGGTCCGG CAAGTCGACG ACGCTCTACG CGACGCTCAA CCTGCTCAAC 
CGGCCCGACG TCAACGTGAT CACCGTCGAG GACCCGGTGG AGTACCGCCT GCCGGGGATC 
AACCAGGTCC AGACGAACGC GAAGGCGGGG CTGACCTTCG CCTCCGCGCT GCGCTCGATC 
CTGCGCTCGG ACCCCGACAT CGTGCTGATC GGCGAGATCC GCGACCACGA GACCGCCCAG 
ATCGCGGTCG AGGCCGCGCT GACCGGCCAC CTGGTGCTCT CGACGCTGCA CACCAACGAC 
GCGCCCTCGG CGGTGACCCG CCTGATCGAG ATGGGCATCG AGCCGTTCCT GGTCGGGTCC 
GCGCTCGACG CCGTACTCGC GCAGCGGCTG TGTCGCTCGC TCTGCGAGCG CTGCAAGCAG 
GCCTACCAGC CGGATCCGGC GGAGCTGCAG CGGATCGGCT TCCCGTGGGC GGAGGGCGCG 
GAGGTGCCGG TGCTGTACCG GCACGTCGGC TGCTCCTCCT GCTCGCAGAC CGGCTACCGC 
GGCCGGATGG CGCTGCACGA GGTGATGACG GTCAGCGAGG AGGTCTCGCG GCTCGCCGTC 
GCGCGCGCGT CGACCGACGA GGTCGGCCGC ACCGCCCGGG AGCAGGGGAT GACCACCTTG 
AAGTCGGACG GCTGGCAGAA GGTGCTGCAG GGCCGCACCT CCATCGAGGA GGTCCTCCGG 
GTCGTCGCCT GA

Protein sequence

MTVRAQTSGD TVRALVEGGW ITRDQLSEAG RLADERSQTV LEVLLESGWV DRTTVVRTAA 
ASAGLEYVEL TDFIVDMAAV SLLPAEFARR TGVLPLVHED GELLVAVSVR QAGDIELKDD 
LSRLTRSRVR FAIAGRSDID ARINQVYRAE GELTDITSDL APEDEVDDLS TLTEVSDEAP 
VVRFVNLLIN QAINDRASDI HIEPTERDMR VRYRIDGVLH DAHRSPKSIQ NGVISRLKIM 
AEMNIAERRV PQDGRMSVTH QGRRIDLRVA TLPTVWGEKV VARILDTSNT QLGLDDLGFS 
NENYERYRAS YTKPYGMILA TGPTGSGKST TLYATLNLLN RPDVNVITVE DPVEYRLPGI 
NQVQTNAKAG LTFASALRSI LRSDPDIVLI GEIRDHETAQ IAVEAALTGH LVLSTLHTND 
APSAVTRLIE MGIEPFLVGS ALDAVLAQRL CRSLCERCKQ AYQPDPAELQ RIGFPWAEGA 
EVPVLYRHVG CSSCSQTGYR GRMALHEVMT VSEEVSRLAV ARASTDEVGR TAREQGMTTL 
KSDGWQKVLQ GRTSIEEVLR VVA