Gene Noca_4478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4478
Symbol
ID	4596997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4734002
End bp	4735198
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	76%
IMG OID	639779089
Product	major facilitator transporter
Protein accession	YP_925662
Protein GI	119718697
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGGGGC GGCGCGCCCC GGGCGTGGAC CGGCCACCCG TCGCCCCGAT CCGGCTGCTC 
CAGCTCGGCG CCTTCGTCAG CACGCTGGAC CGGTTCGCGC TGCCGCCGAT GCTGGTCGCG 
ATCGCCCACG ACCTGGGAGC CCCGCTCGGC GAGGTCGTCA CGGCGGCCGG CGCCTACTTC 
CTGGTCTACG GCCTGAGCCA GCCGGTGTGG GGCACGGTCT CCGACCGGCT CGGCCGGGTC 
CGGACGATGC GGATGACGCT GCTGCTGGCG GGGGTCTTCA CCCTCGTCTC GGCGCTGAGC 
TGGTCGCCGC TCTCGCTCGG GGTGACCCGC GGCCTCGCGG GCGGGTTCTT CGGCGCGGCG 
TACCCCTCGA GCCTGATCTA CCTCGGCGAC ACGGTGCCCG CCCCCTCCCG GCAGCGCGAC 
ATCGCACGGC TGATGGTCGG GGTGGCGATG GGCACCGCGC TCGCCTCGGT CGGCGCCGGC 
GTGCTCGCCG ACGCCGTGAG CTGGCGGGTG GCGTTCGTGG TCACCGGCAT CGCGTCGCTG 
GTGATGACCT GGGCCCTGCG CGGCCTGCCG GAGCCCACCG CACACGGCAG GCCGGCCTCG 
GCGATGGACG GGCTGCGCGC GATCAGCGGC GCGCCGATCG CGCTGCTGAT GCTGGTGTTC 
GCGTTCACCG AGGGCGCGGT GCTGCTGGGC GCCCTCACGC TGCTGCCGCC CGCGGTCGAG 
AACGCCGGCG CCACCGCGGC GCTCGCCGGT GCGGTGACCG CGATCTACGG GGTCTCGGTG 
TTCGCCAGCT CGCAGCTGGT CGGGCGGCTC GCCGCGACCT GGCACCCGTC GCGGCTGATC 
GCGATGGGCG CAACCGCCGC CGCCGCCGGC TGCGGGCTGC TCGCGGTCTC CCAGGAGCCG 
GCCGTCGCAG TGGTGGTCGC CCTGCTCGTC GGCCTGGCCT GGACCTCGAT GCACTCCTCG 
CTGCAGACGT GGGCGACCGA GGTGCTGCCG GGCGCGCGGG CGACCGTGGT CTCGTTCTTC 
GCCGGGTCGC TGTTCGTCGG GAGCGCGCTG GCCGCGGTGC TGGTCGCCGG CCTCGCGGAC 
GCCGGCCGCT ACACGGCGAT CTACGCCGTG TACGCCGCGC TCGCGGTGCC GCTCGGCCTC 
GCGGCCGGTC TGGCGCGGCG GCGCTGGGTG CGCCCGGCCG CGGAGCGGGG AACCTAG

Protein sequence

MRGRRAPGVD RPPVAPIRLL QLGAFVSTLD RFALPPMLVA IAHDLGAPLG EVVTAAGAYF 
LVYGLSQPVW GTVSDRLGRV RTMRMTLLLA GVFTLVSALS WSPLSLGVTR GLAGGFFGAA 
YPSSLIYLGD TVPAPSRQRD IARLMVGVAM GTALASVGAG VLADAVSWRV AFVVTGIASL 
VMTWALRGLP EPTAHGRPAS AMDGLRAISG APIALLMLVF AFTEGAVLLG ALTLLPPAVE 
NAGATAALAG AVTAIYGVSV FASSQLVGRL AATWHPSRLI AMGATAAAAG CGLLAVSQEP 
AVAVVVALLV GLAWTSMHSS LQTWATEVLP GARATVVSFF AGSLFVGSAL AAVLVAGLAD 
AGRYTAIYAV YAALAVPLGL AAGLARRRWV RPAAERGT