Gene Arth_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1810
Symbol
ID	4445674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2025958
End bp	2027124
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	63%
IMG OID	639689628
Product	ABC-type sugar transport system periplasmic component-like protein
Protein accession	YP_831300
Protein GI	116670367
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0233725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCAAC GGAGAAACCG CTACCGGGGG AGCGCGGCAG TAGCCGTGCT TGCCTGCCTT 
GTCGCACTGA CCACGGCCTG CGGTCCCGCC CCGGCCAGCC AGACGTCACA GGCAGACTCC 
GAGGCGTCAG CGGCGTTCAC GGCAAAAATC ACCGCCGACG TCGCAGCTGC AACCGCACCG 
CAGACCACCA CGACCAACCC CGTCCCAGCC AGCGCATCGC TCTCCAACGG GCCCAAGAAG 
ATCGTGATCA TTCCTTGTTC CATGGCCGTG GAAGGGTGCG CGCGGCCGGC CCGTTCAACG 
CAGGAAGCCT CGCGGCTGCT TGGCTGGGAC GCGAGCATCG ACGACCCCGC GAGCGACAGC 
ACCAAGATCT CCGCGGCCAT CCAGCGGGCA GTCTCCCGGA AAGTCGATGC CATCGCGTTG 
ACGTCCATCG ACGCCGCTGC AGTTCAGGGT GACATCAAGT CGGCCAGGGA TGCAGGCATC 
GCCGTCACCT GCAACATGTG CGGCAACAAG GATGACCTTT ACCAGTCGCT GATTCCAGCT 
CTGGACGCAA ACAACAAAGC AGGATACCTC TTGGGGGAGT TCGCGTTCCT TGAAGCGCGC 
AAGCGTTTCA ATTCAGCACC GAAATTCATC GTCCTGACCG ATCCGGAATT CGACACCGTG 
AAGGCGCGCG TGAGCGGCCT CAAACAGTTC ATTGAGGACT GCAAGGCTGC CGGAGCAGGT 
TGCGAGCAGG TAGCCGAGAG CTCGTTCCTG GCAGGTGAAA TCAGCACCGT CGCGCCAGGG 
CGCGTTGCCC AGTTGGCCCG CAGCAACCCG CGCTACAACG TGCTGTTCGC AGGATTCGAC 
GCGGCCATGC TGTTCTTCTC CCAGGGGCTA CAGCAGGCAG GGCTGGCTGA TTCCAAGAAA 
GCTTTCGGAA TTTCGGTGGA CGCCGACGTG GCCAATACCG AGATGATCCG CAAGGGGGGT 
TTCCAGGCGG CGTCCATCGG ATTCGCCTTC GGCCGTGCAG GTTACGGCCA GGTGGACAAT 
CTCAACAGGA TCTTCAGTGG CCAGAAGCCG CAGGACCAGG GCATCACCGG CAAGCTCGTT 
ACAGCGGAGA ACGCCCCGGC TTCCGGCGGC TGGGACGGAG ACTTCGACGG AGTCGCCCTT 
TACAAGGGAC TGTGGAAGGT CGGCTGA

Protein sequence

MFQRRNRYRG SAAVAVLACL VALTTACGPA PASQTSQADS EASAAFTAKI TADVAAATAP 
QTTTTNPVPA SASLSNGPKK IVIIPCSMAV EGCARPARST QEASRLLGWD ASIDDPASDS 
TKISAAIQRA VSRKVDAIAL TSIDAAAVQG DIKSARDAGI AVTCNMCGNK DDLYQSLIPA 
LDANNKAGYL LGEFAFLEAR KRFNSAPKFI VLTDPEFDTV KARVSGLKQF IEDCKAAGAG 
CEQVAESSFL AGEISTVAPG RVAQLARSNP RYNVLFAGFD AAMLFFSQGL QQAGLADSKK 
AFGISVDADV ANTEMIRKGG FQAASIGFAF GRAGYGQVDN LNRIFSGQKP QDQGITGKLV 
TAENAPASGG WDGDFDGVAL YKGLWKVG