Gene Arth_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4039
Symbol
ID	4447875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4557657
End bp	4558736
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	61%
IMG OID	639691870
Product	extracellular solute-binding protein
Protein accession	YP_833514
Protein GI	116672581
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACAAAC TCAAGACAAT GGTTGCCGCC GTCGTCGCCA TCACCCTTCT AGCCGGCTGC 
GGCGCCGGCA GCGCGGCTCC CGAAAGCTCC GGAAGTTCCT CCGCCGCAGG GGCGTCGGGC 
GACACTCTGG TGGTGTACAC CAACTCCAAC GGAGAGGGCC GCGGAGAGTG GCTGACGAAA 
AAGGCAGCGG ACGCCGGCTT CAAGATTGAG ATTGTGGGCG CCGGCGGCGC AGACGCGACC 
AACAAACTGA TCGCCGAAAA GAACAACCCC ATTGCGGACG TCGCCTTCGG CCTCAACAAC 
ATGTACTTCG CCCAGGTCAA AGCGGCCGGT GCGATCGAGG CCTATGAGCC TGCCTGGGCA 
GGCGAAGTGG ATCCCTCGCT CGCAGACAGC GACGACGACA AAGCCTACTG GCCGCTGGTT 
AAGCAGGCCA TTATGCTCGG CTACAACTCG GATAAGTTCA CCCCGGAGCA GGCACCGAAG 
GACTGGACGG ACCTGTGGTC CAAAGACGAG TTCAAAACAC GCTATGAGCG GGTCACTGGT 
CTGGGAACCG CCACGGCGCA GCTGGTATTC GCCGGTATTC TCGCCCGCTA CAAGGACGAT 
TCCGGTGACT TGGGCATCTC CGATGAAGGC TGGAAGCAGG TGGAGCAGTA CTTCAAGAAC 
GGCAGCCCCG CCGTCGCGAA AACCGATCTC TTCGCCCGCA TCGCGTCTGG CGACGTGGAC 
ATGGGTCAGA TGCCGTCGTC CATCGTGGCG GAACGCGAGA AGTCCTTCAA GGTGAATGTC 
GAAACGGTGG TGCCGTCCGT GGGCGTCCCC CTCGCCGTGG AGCAGGTCGC CCTGGTGAAG 
GGAACCGACA AGAAGGAACA GGCCCAAAAG TTCATCGACT GGTTCGGCAG TGCCGACGTC 
CAGGGTGAGT TTGCACAGCA GTTCAACTCC ATGCCGGTGA ACAAGAGCGC CGCCGCCAAG 
GCCAAGCCGG AGGTGGTGGA GTTCTTCAAC GGACTGAAGC AGCAGGAGAT TGACTGGAAC 
TTCGTCCAGG AAAACATGGG CTCGTGGGTG GAAAAGATCG AGCTCGAGTA CATGACGTAA

Protein sequence

MHKLKTMVAA VVAITLLAGC GAGSAAPESS GSSSAAGASG DTLVVYTNSN GEGRGEWLTK 
KAADAGFKIE IVGAGGADAT NKLIAEKNNP IADVAFGLNN MYFAQVKAAG AIEAYEPAWA 
GEVDPSLADS DDDKAYWPLV KQAIMLGYNS DKFTPEQAPK DWTDLWSKDE FKTRYERVTG 
LGTATAQLVF AGILARYKDD SGDLGISDEG WKQVEQYFKN GSPAVAKTDL FARIASGDVD 
MGQMPSSIVA EREKSFKVNV ETVVPSVGVP LAVEQVALVK GTDKKEQAQK FIDWFGSADV 
QGEFAQQFNS MPVNKSAAAK AKPEVVEFFN GLKQQEIDWN FVQENMGSWV EKIELEYMT