Gene Noca_2222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2222
Symbol
ID	4598720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2369027
End bp	2370706
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	70%
IMG OID	639776822
Product	type II secretion system protein E
Protein accession	YP_923415
Protein GI	119716450
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCA ACGGACACCA CCCGGAGACC AACCGCCGCG ACCCGCTGCG CGCAGACGAG 
TGGCTTGAGG CCCGCCATCC CGCGAACCGT GAGCAGACCT CGCCGTTCGC CCGAGGACGC 
GGTTCCAACG GCACCCCGCC GCCCCCGCCG GTCGTCGAGG ACGACGACCC GACCTCGCTG 
CCGATCTTCG CCGGCGCCTG GACCAGCGAA GGCGAGGGCC AGATGCCTGG CCGCGCCCGC 
TCGGAGTTCA GCCTGCGCCC GCTTGTGGCG CCCGCACCGG AGCAGCACCA AGACACCCGC 
GGCACGGATG GCGAGGTCGA GCTGGACTGG GAGCTGATCG CGCAATACCG CGCTGAGATC 
TCCGCGCGAC TGACCGCCCG GCTCGACAAG GAAGGTGGTC GGGTCACCGA GGAGGACCGC 
GAGCAGATGG GCCTCGACGT CATCGAGGAG CTCATCAAAT CCGAGGCCGA GACGTTGGTC 
TCGACCGGCC GTCCGCCGTG GACGAAGGAC CACGAGAAGG CACTCAAGTC CGCCCTCCAC 
GCCGCCCTGT TCGGGCTCGG CCGCCTGCAG CCCCTGGTCG AGCGCGAGGA CGTCGAGAAC 
ATCATCGTCA TCGCCCGCGG CCCGGTCTGC TCGGTGTGGC TGGAGCTGGT CGACGGCACC 
CTTGTGGAGG CCGCCCCGAT CGCCGACTCC GAGGACGAGC TGCGCGAGTT CCTCTCCGAC 
CTAGGCGCAC GGCAGAACCG GCCCTTCACC GAGGCCCGGC CGCACCTGGA CCTCCGGCTG 
CCCGGGGGAG CGCGGCTCGC GGCCGGCTCC TGGGTGATGG CCTACACCTC CGTCGTGATC 
CGTCGCCACA GCATGCGCGA GGTGTCGATG GACGAGATGG TCTACGACCG CAAGGCGTGC 
AGCGCGGTCC TGGCCGACTT CGTCGCAACC TGCGTGCGGG CGGGCAAGAG CATCGTCGTC 
TCCGGGGTCC AAGGCAGCGG CAAGACCACC TGGGTCCGGG CCCTGTGCTC GTGCATCCCG 
CCCTGGGAGA TGATCGGCAC CTTCGAAACC GAGTTCGAGC TGCACCTGCA CGAGCTCGTC 
GACCGCCACA AGATCGTCCA CGCGTGGGAG CACCGCCCCG GATCCGGCGA GGTCGGCATC 
GACGGCCGCC AGGCCGGTGA GTTCAGCCTC GAGGAGGCCA TCCACCACTC CTTCCGGTTC 
AGCCTCGCCC GCCAGATCGT CGGTGAGGTC CGCGGCCCGG AGGTCTGGAA CATGCTCAAG 
GCCATGGAGT CCGGGCCGGG CTCGATCAGC ACCACCCACG CCCGCAGTGC CGAGCACACG 
ATCGAGAAGC TCGTCTCCTG CGCCATGGAG AAAGGCCCCC AGGTCACCCG CGAGCTGGCG 
ATCAGCAAGC TGGCCGCCGC GATCGACATC GTGATGTACC TGCGCTCGGA GGTCGTCGCC 
AATCCCGACG GCACCTTCCG CAAGCAGCGC TGGGTCGAGG AGGTCCTGGT CGTCCAGCCC 
AGCATCGACG CCGCCAGGGG ATACGCCACC ACCCCGATCT TCACCCCTAA CCAGCTCGGC 
CAGGCCGTCG CGACCGGCAA GCTCGACAAC TTCCTCGCCC AGGAGCTGGC GCGGCATGGG 
TTCGACCTCG AGGCGTACAA GGCCGAGTCC CAGGCCAACC CGGGGGTGGC CACCTCATGA

Protein sequence

MSTNGHHPET NRRDPLRADE WLEARHPANR EQTSPFARGR GSNGTPPPPP VVEDDDPTSL 
PIFAGAWTSE GEGQMPGRAR SEFSLRPLVA PAPEQHQDTR GTDGEVELDW ELIAQYRAEI 
SARLTARLDK EGGRVTEEDR EQMGLDVIEE LIKSEAETLV STGRPPWTKD HEKALKSALH 
AALFGLGRLQ PLVEREDVEN IIVIARGPVC SVWLELVDGT LVEAAPIADS EDELREFLSD 
LGARQNRPFT EARPHLDLRL PGGARLAAGS WVMAYTSVVI RRHSMREVSM DEMVYDRKAC 
SAVLADFVAT CVRAGKSIVV SGVQGSGKTT WVRALCSCIP PWEMIGTFET EFELHLHELV 
DRHKIVHAWE HRPGSGEVGI DGRQAGEFSL EEAIHHSFRF SLARQIVGEV RGPEVWNMLK 
AMESGPGSIS TTHARSAEHT IEKLVSCAME KGPQVTRELA ISKLAAAIDI VMYLRSEVVA 
NPDGTFRKQR WVEEVLVVQP SIDAARGYAT TPIFTPNQLG QAVATGKLDN FLAQELARHG 
FDLEAYKAES QANPGVATS