Gene Noca_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0101
Symbol
ID	4600074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	114503
End bp	115531
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	71%
IMG OID	639774711
Product	inner-membrane translocator
Protein accession	YP_921333
Protein GI	119714368
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.832216
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGTGG GTACAACTAC CGGTCACGAC ACGGACGCCG TCGCGCCGGC CCAGCCGGGC 
GCTCGTCGCT GGACCTCGCG CATCGAGGCC GGCGCCCTGC CCGCGGCCTG GCTCGTCGTC 
TTCGTCGTCT TCGCCGTGCT GCTGCCGGAC ACGTTCCTGA GCACGGCGAG CGTCTCGAAC 
ATCCTGGGAT CGCAGGCGGT CCCGCTGGTG CTGACGCTGT GCCTGGTGCT GCCGCTGGTG 
TGCGGCGACT ACGACATGTC GGTCGCGTCC GTCGCCACCC TCACCGCCAT GGTGATCGGC 
ATCTTGAACG TCAACCACGG ATGGTCGATC GGCGCCGCGA TCCTGGCGGG CCTCCTGGCG 
GCCCTGCTGG CCGGGTTGGT GAACGGCGCC GTGATCGTGA TCTTCGGGGT CGACTCGCTG 
ATCGTCACGC TCGGCACGGG GACCGTGATC CAGGGCCTGG TCCTCTGGAT CAGCGACTCC 
ACGACGGTCA GCGGCATCTC GACCTCGCTG GTCGACCTGG TCATCGGCTA CAAGCTGTTC 
AGCGTGCCGG CGGCGTTCTA CTACGGCCTC GCGCTCTGCG TCGTGCTCTG GTACCTGCTG 
CAGCACACCG CGCTCGGGAT GCGCATGCTG TTCATCGGGC GGGGCCGCGA CGTCGCGCGC 
CTGAGCGGCA TCGCGGTCCC CCGGGTCCGC ATGGGTGCCC TGGTGGCGTC GGCCGGACTG 
GCGGGCGTGG CGGGCACCCT GTACGCCGGC ACCACCGGCT CGGCGGACCC GAGCTCGGGC 
ACCTCGTTCC TGCTGCCGGC GTTCGCCGCG GTCTTCCTCG GCGCGACCAC CGTGATCCCG 
GGCCGCTTCA ACGCCTGGGG CGCGTTCATC GCCGTCTACT TTCTCGCCAC CGGCATCACC 
GGGCTCCAGC TCCTGGGGGC GGAGAGCTTC GTGCAGCAGC TCTTCTACGG CGGCGCGCTG 
GTCATCGCCG TCTCCCTGGC GCAGCTGGCC CGCCGCCGCG AGGCGAGCAG CGCGGGCACC 
ACCTCCTGA

Protein sequence

MSVGTTTGHD TDAVAPAQPG ARRWTSRIEA GALPAAWLVV FVVFAVLLPD TFLSTASVSN 
ILGSQAVPLV LTLCLVLPLV CGDYDMSVAS VATLTAMVIG ILNVNHGWSI GAAILAGLLA 
ALLAGLVNGA VIVIFGVDSL IVTLGTGTVI QGLVLWISDS TTVSGISTSL VDLVIGYKLF 
SVPAAFYYGL ALCVVLWYLL QHTALGMRML FIGRGRDVAR LSGIAVPRVR MGALVASAGL 
AGVAGTLYAG TTGSADPSSG TSFLLPAFAA VFLGATTVIP GRFNAWGAFI AVYFLATGIT 
GLQLLGAESF VQQLFYGGAL VIAVSLAQLA RRREASSAGT TS