Gene Arth_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1104
Symbol
ID	4446407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1196607
End bp	1198166
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	61%
IMG OID	639688910
Product	ABC transporter related
Protein accession	YP_830598
Protein GI	116669665
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.296869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTCCC AGACCACGCA AAGTGATCCG ATCCTTCTCG AGATGCGGTC CATCACCAAG 
GAATTCCCCG GCGTTAAAGC TTTGTCCGAG GTGAGCCTGC GGGTGAAGGC GGGCGAAATC 
CACGCCATCT GCGGCGAGAA CGGCGCCGGC AAGTCCACCC TCATGAAGGT CCTCTCGGGC 
GTGTACCCGT ACGGCAGCTA CGACGGCGAC ATCGTGTACC AGAACGAGGT CCAGCAGTTC 
AAGGACATCC GTGCCAGCGA GCAGGCCGGC ATCGTGATCA TCCACCAGGA ACTCGCGCTT 
ATCCCGGAAC TCTCCATCAT GGAGAACATC TTCCTCGGCA ACGAGCCCAC CAAGCGCGGC 
ATGATCGACT GGGCAGAAGC CCGGCTGCGG TCCACGGAAC TGCTGGCCCG GGTGGGCCTG 
CGCGAAGATC CCGATACCGC CATCAAGGAG ATCGGCGTCG GCAAGCAGCA GCTGGTGGAA 
ATCGCCAAGG CGCTGAGCAA GTCAGTGAAG CTCCTTATCC TCGACGAGCC CACGGCGGCA 
CTGAACGAGT CCGACTCCCA GCACCTGCTG GACCTCATGC TGGGGCTCAA GGGCCGCGGC 
ATCACGTCCA TCATCATTTC CCACAAGCTC AATGAGATCG AGCAGATCGC GGACTCCATC 
ACCATCATCC GTGACGGCAA GTCCATCGAG ACCCTCGATG TCAAGGCCGA CGGCGTGGAC 
GAGGACCGCA TCATCAAGGG CATGGTGGGC CGCACGCTTG AGTCACGCTT CCCGGACCAC 
GAACCGAAAA TCGGCGAAGT GTTCTTCGAA GTCAAGGACT GGAACGTGGG GCACCCGCAG 
ATCCAGGACC GCCTGGTCTG CAAGAATTCC AACTTCTTCG TCCGCCGCGG CGAGATTGTC 
GGCTTTGCCG GGCTCATGGG CGCCGGACGC ACCGAGCTGG CCCGTTCAGT GTTCGGCCGC 
TCGTACGGCC GGTTCATCTC CGGCCATATC TACAAGGACG GCAAGGAGAT CACCCTCCGC 
ACCGTGAAGC AGGCTATCGA TGCCGGGCTG GGCTACGTGA CCGAGGACCG CAAGTCCCTG 
GGACTGAACC TCCTGGATGA CATCAAGACC ACCACCGTTG CAGCGAACCT GAAGAAGATC 
AGCAAGCACA ACATCGTGGA CCCCAACAAG GAATTCACCG TTGCGGAGCA GTACCGGAAG 
TCATTGCGCA CCAAGGCGCC CTCAGTGGAA GAAGGCGTCG CCAAGCTCTC GGGCGGCAAC 
CAGCAGAAGG TGGTACTCGC CAAATGGATG TTCACCGACC CGGACCTGCT GATTCTTGAC 
GAACCGACCC GCGGCATTGA CGTGGGCGCC AAGTACGAGA TCTACGGCAT CATCCAGCAG 
CTGGCCAACC AGGGCAAAGG CGTGATTGTG ATCTCCTCCG AGTTGCCGGA ACTGCTGGGA 
CTCTCGGACC GCATCTACAC CATCTTCGAA GGCGCCATCA CCGGTGTCCT GAACAAGGAT 
GAAGCCAGCC AGGAAAACCT GATGAAGCTC ATGACATCCG CCCGCAAGAC CGCCGCCTGA

Protein sequence

MTSQTTQSDP ILLEMRSITK EFPGVKALSE VSLRVKAGEI HAICGENGAG KSTLMKVLSG 
VYPYGSYDGD IVYQNEVQQF KDIRASEQAG IVIIHQELAL IPELSIMENI FLGNEPTKRG 
MIDWAEARLR STELLARVGL REDPDTAIKE IGVGKQQLVE IAKALSKSVK LLILDEPTAA 
LNESDSQHLL DLMLGLKGRG ITSIIISHKL NEIEQIADSI TIIRDGKSIE TLDVKADGVD 
EDRIIKGMVG RTLESRFPDH EPKIGEVFFE VKDWNVGHPQ IQDRLVCKNS NFFVRRGEIV 
GFAGLMGAGR TELARSVFGR SYGRFISGHI YKDGKEITLR TVKQAIDAGL GYVTEDRKSL 
GLNLLDDIKT TTVAANLKKI SKHNIVDPNK EFTVAEQYRK SLRTKAPSVE EGVAKLSGGN 
QQKVVLAKWM FTDPDLLILD EPTRGIDVGA KYEIYGIIQQ LANQGKGVIV ISSELPELLG 
LSDRIYTIFE GAITGVLNKD EASQENLMKL MTSARKTAA