Gene Noca_0030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0030
Symbol
ID	4598384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	33397
End bp	34605
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	75%
IMG OID	639774645
Product	major facilitator transporter
Protein accession	YP_921267
Protein GI	119714302
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.63894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAGG GCTCCCGCGC GGTGCTGCCG CGACCCACCG GCGGCTTCGA CCGCGCATCG 
ATGAGCGCCT CCCTGGCCGG GGTGGCGCTC AGCGTGCTTC CCGTCTACCT CCTCGGCGGA 
CTCACGGTCT TCATCGCCGA CGACCTCGAC TACGGGGTGG TCGGACTCGG GGCGGCGGCC 
TCGGCGTTCT ACGCGGCCTC CGCGGTCGCC TCGATCCCGG CCGGCCGAGT CGCCCACCGG 
CTGGGAGCCG AGCGGTCCTT GATCCTCGGC GTGTGCGTGT CGTCCGCGGC GCTGCTCGCG 
GTCGCCCTGG TCGTGCAGGC CTGGTGGAGT CTGTGTGTGG CCCTGGTCGT CGGCGGCGTG 
GCGACCGCGC TCGTCCAGCC GGCCGCCAGT GCGCTCGTGG CACGGGACCA GCCCGACAGC 
CGCCACGGCC TGAGCTTCGG CCTGCTCCAG ACGGCCGTCC CGGTGGCCAC CCTCGCTGCC 
GGACTGGCGG TGCCGGTGAT CGGGGCCACG TGGGGCTGGC GATGGGCCTA CGGCCTCCTG 
GCGCTGGGCG CCATCCCGAT CGTCGCGTTC GGGCTGCGCC GGGCACCGCG CCGTCTGGAG 
CGGCGAGCCA ACCCTCCGAG CGCGTCCCGG CCGATCCGCG GCGCCGCGAT CGTCCTGCTC 
ACGCTCGCCG GCGCCTGCGC GGCCGCGCCC GCGAACGCCC TCGGCGCCTA CTACGTCGAG 
TCCGCGGTCG CCGCCGGCAT CTCCCGGTCC GGCGCGGGTC TGTGGCTGGT GGCCGGCAGC 
GCCGTGGGTA TCGGGGCGCG CCTGCTGTGG GGTTGGATGA TCGACCGCAG GGGGGCCGAC 
CCGCGCCTGT GGATCGCGGG CCTGATGCTC AGCGGAGGCG TCGGCTTCGC GCTGCTCAGC 
GTGACCCACA CCGCTCCCGT CCTGTTCGCC GCCACCGCGC TGACCTTCGG GGCCGGGTGG 
GCGTGGAAGG GTCTGTACAA CCTCGCGGCG ATCCGGCACG ACCCCGAGCA GCCGAGCGCG 
GCCGTCGGCA TCGCGCAGTT CGGGGTCTAC GTCGGGAGCG TCCTGGGCCC GATCGCTTTC 
GGCGTCCTCC TGGCGCACAG CTCCTACGCC GTGGCCTGGG CGGCCGCCGG GGTCACCTGC 
CTGCTGACCC CGGTGCTCAT CTGGGTCCAG CGCCGGCTCG GTCGGCCGGC CGCCGGGCAC 
GGTATCTGA

Protein sequence

MAEGSRAVLP RPTGGFDRAS MSASLAGVAL SVLPVYLLGG LTVFIADDLD YGVVGLGAAA 
SAFYAASAVA SIPAGRVAHR LGAERSLILG VCVSSAALLA VALVVQAWWS LCVALVVGGV 
ATALVQPAAS ALVARDQPDS RHGLSFGLLQ TAVPVATLAA GLAVPVIGAT WGWRWAYGLL 
ALGAIPIVAF GLRRAPRRLE RRANPPSASR PIRGAAIVLL TLAGACAAAP ANALGAYYVE 
SAVAAGISRS GAGLWLVAGS AVGIGARLLW GWMIDRRGAD PRLWIAGLML SGGVGFALLS 
VTHTAPVLFA ATALTFGAGW AWKGLYNLAA IRHDPEQPSA AVGIAQFGVY VGSVLGPIAF 
GVLLAHSSYA VAWAAAGVTC LLTPVLIWVQ RRLGRPAAGH GI