Gene Arth_1278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1278
Symbol
ID	4446255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1416945
End bp	1418375
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	67%
IMG OID	639689086
Product	sodium:dicarboxylate symporter
Protein accession	YP_830772
Protein GI	116669839
COG category	[C] Energy production and conversion
COG ID	[COG1301] Na+/H+-dicarboxylate symporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.421424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACTC AAACCAGCAC CCCCTCCCCC GCAGGAAACA CCGGCTTCCG GCTGCCCAAA 
TGGGCCGGTT CATTCGGCTT CCAGATCATC GCCGCCCTGA TCGTGGGCCT GGGCCTCGGC 
CTCCTGGCCA AGTACACGGG CAGCACCAAG GCGAGCCCCA ATGCCCTCGG CGCCACCCTG 
CAGACCATCG GCTCGAGCTA CGTCTCGCTG CTGCAGACCG CCGTGGTTCC CCTCATCTTC 
ACCGCGGTGG TCAGCTCGAT CTCGAACCTC CGCCAGGTGT CCAACGCCGC AAAGCTGGCG 
TGGAACACGC TCCTATGGTT CGCCATCACG TCCCTGATCG CAGTGCTGAT CGGCATCGGC 
CTGGGTGTGC TGCTCCAGCC CGGCGCCAGC ACCGGCATCA CCCAGGAAGC CAAGTACTCC 
GGCAAGTCCG GTGACTGGTG GGCGTTCCTG GTCGGACTCT TCCCCAAGAA CTTCCTGGGC 
CTGGGTGCCA GCTCCACCGT TGCTGAATCA GGCGCCGTGA CCACCGCGGT CAGCTTCAAT 
GTCCTCCAGA TCCTGGTGAT CGCGATCGCC GTCGGCGTGG CCGCCCTGAA GGTGGGCAAG 
GCAGCTGAGC CGTTCCTGAC CCTGAACGCT TCCGCCCTCG CCGTCATCCA GAAGGTGCTG 
TGGTGGATCA TCCGGATCGC CCCGCTGGGC ACCGTTGGCC TCATTGGCAA CGCCGTGGCC 
GTCTACGGCT GGGACACCAT CGGGTCGCTC GGCAAGTTCA CCTTTGCCAT CTACGTGGGC 
CTGGCCCTGG TGCTGTTCGT GGTCTACCCC GTCCTGATCC GCACCCACGG GTTGTCCGTC 
AAGCAGTATT TCTCCGGTGT CTGGCCCGCT GTGCAGCTGG CCTTCGTTTC CCGCTCTTCC 
GTGGGCACCC TGCCGCTGAC CCAGCGCGTC ACCGAGCGCA GCCTGGGCGT CCCCCGGGCC 
TACGCCTCCT TCGCCGTGCC CCTGGGCGCC ACCACCAAGA TGGACGGTTG CGCCGCGATC 
TACCCTGCCA TCTCGGCGAT CTTCGTCGCC CAGTTCTTCG GCATCCAGTT GGACTTCAGC 
CAGTACCTGC TGATCGCCCT CGTCTCCGTG CTGGGCTCCG CCGCGACTGC CGGTACCACC 
GGCGCCGTCG TCATGCTGAC CCTGACGCTC TCCACGCTGG GACTGCCGCT GGCCGGCGTC 
GGCCTCCTGC TGGCGATCGA TCCGATCCTG GACATGGGCC GCACGGCGGT CAATGTCGCC 
GGGCAGGCGC TCGTCCCCAC GATCGTTGCC AAGCGCCAGG GCATCCTGGA CGAGTCGCTC 
TACAACGCAC CGCGTAACGG CGACCCGTTC GCAGACGACT CCACCGAGGC GGTTGCCGAT 
CCGACGGCGG CTGCAGTGGA CGGCCGCGAA CTTGCCGACG CGAAAGCCTG A

Protein sequence

MSTQTSTPSP AGNTGFRLPK WAGSFGFQII AALIVGLGLG LLAKYTGSTK ASPNALGATL 
QTIGSSYVSL LQTAVVPLIF TAVVSSISNL RQVSNAAKLA WNTLLWFAIT SLIAVLIGIG 
LGVLLQPGAS TGITQEAKYS GKSGDWWAFL VGLFPKNFLG LGASSTVAES GAVTTAVSFN 
VLQILVIAIA VGVAALKVGK AAEPFLTLNA SALAVIQKVL WWIIRIAPLG TVGLIGNAVA 
VYGWDTIGSL GKFTFAIYVG LALVLFVVYP VLIRTHGLSV KQYFSGVWPA VQLAFVSRSS 
VGTLPLTQRV TERSLGVPRA YASFAVPLGA TTKMDGCAAI YPAISAIFVA QFFGIQLDFS 
QYLLIALVSV LGSAATAGTT GAVVMLTLTL STLGLPLAGV GLLLAIDPIL DMGRTAVNVA 
GQALVPTIVA KRQGILDESL YNAPRNGDPF ADDSTEAVAD PTAAAVDGRE LADAKA