Gene Arth_3697 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3697
Symbol
ID	4443698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4158906
End bp	4160522
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	64%
IMG OID	639691521
Product	permease for cytosine/purines, uracil, thiamine, allantoin
Protein accession	YP_833172
Protein GI	116672239
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACATAT CGTATCTTGT TGCGTGTGGT CTGCGGCACA TACTCTGGCT GTATCCCCTT 
TCTCCCACGG AGGCCCACAT GCAAAACAAC TCCACTGCAG TCCCGGCCGG CCACGTGCCC 
GCAGCCGGCG AAGACGTTGA AGCCTGGCTT CAGCCCATCC CCGAATCACA GCGGACCCGG 
AAGGTTTCCG GACAGTTCTG GATCTGGGCG GGAGCCAACC TGGCGCCCAT CAACTGGGTG 
CTCGGCGCCC TGGGCATCCA CCTCGGACTT GGCTTCGCCG ACACCGTTAC CGTCCTGGTT 
TTGGGGAACC TGATCGGCAT GCTTCTGTTC GGCTGCTTCG TACTGCTGGG CCAGAAGACA 
GGTGCCACGG GCATGGTGCT GGCCCGCGCG GCATTTGGCC GGCGCGGAAA CTACCTTCCC 
GCCGCCATCC AGGCGCTACT GGTCATCGGC TGGTGCGCCG TCAACACCTG GATCATCCTG 
GACCTTGTCA TGGCACTCTT CGGCACCCTC GGCTGGGTGG ACCCGACAGC CCACAACTAC 
GCCTGGAAGA TCGGTGTCGC CACCACCATC ATGGCTGCGC AGGTTGCCAT CGCCTGGTTC 
GGCTACAAGG CTATTGCGGC TTTTGAAAAG TGGACCGTGC CGCCCACCAT CATCATCCTC 
GCGGTGATGT CCGCCGTCGC CTGGTTCGGC ATGAAGATCA ACTGGTCCTA CGCCGGACCC 
GCCGGCAACA TCCTCGAAGG CTCGGAGCGG ATCGCGGCCA TGAGCGCCGT TATGACGGCC 
ATCGGCATCG GCTGGGGAAT CACCTGGTTC ACCTACGCCG CTGACTACTC CCGTTTTGTG 
AGCACCGAGG TGCCGAAGCG CAAGGTCTAC CTGGCCTCAG TGCTGGGGCA GTTCATCCCG 
GTCGTCTGGC TCGGAGTCCT GGGCGCCAGC CTTGCAACCA ACAGTGGCGA GATCGACCCC 
GGAAAACTCA TCGTGCAAAA CTTCGGAGTC CTCGCGCTTC CGGTACTCCT GATGGTCCTG 
CACGGACCCA TCGCCACCAA CATCCTGAAC ATCTACACCT TCTCAGTCGC AACCCAGGCC 
CTCGACATCA CCATCAGCCG CCGCAAGCTC AATCTGTTCG TCGGCGTTTT CTCGCTCATC 
GCCGTCGTAT TCTTCATCTT CCAGGAGGAC TTCGCCTCCG TCCTGGATGC GTGGCTGATC 
GGTCTCGTGG CCTGGGTGGC CGCCTGGGGC GGCGTCATGC TGGTGCATTT CTTCTGGATC 
GAGAAGCGCT GGCCCGGCGA GGCCTCACGG CTGTTCGACG GCGTGGGCAC TAAGCGGCTC 
CCCGGAGTCA ACTGGGCGGG CGTCGTGTCC CTCCTGGTCG GCATTTTCGC CACCTGGCTG 
TTCATGTACG GCCTGGTTCC CGCAATGCAG GGCCCCATCG CAGTGGCACT GGGCGGCTGG 
GACCTCTCCT GGCTCGCCGG CGGCGTCAGC AGCGCAGCGT GCTACGCAGT TCTTGGCCCC 
CGGGTCCACC GGAAATTTCT GGCCGGCGGC GCCGCTGAGC CGGTCCAGGT AACCGTCCCG 
GAGACGACGG TCCCGGAACC TTCAGCCCGC CCGTCAACCA CCGCAGTCTC GCTGTAG

Protein sequence

MYISYLVACG LRHILWLYPL SPTEAHMQNN STAVPAGHVP AAGEDVEAWL QPIPESQRTR 
KVSGQFWIWA GANLAPINWV LGALGIHLGL GFADTVTVLV LGNLIGMLLF GCFVLLGQKT 
GATGMVLARA AFGRRGNYLP AAIQALLVIG WCAVNTWIIL DLVMALFGTL GWVDPTAHNY 
AWKIGVATTI MAAQVAIAWF GYKAIAAFEK WTVPPTIIIL AVMSAVAWFG MKINWSYAGP 
AGNILEGSER IAAMSAVMTA IGIGWGITWF TYAADYSRFV STEVPKRKVY LASVLGQFIP 
VVWLGVLGAS LATNSGEIDP GKLIVQNFGV LALPVLLMVL HGPIATNILN IYTFSVATQA 
LDITISRRKL NLFVGVFSLI AVVFFIFQED FASVLDAWLI GLVAWVAAWG GVMLVHFFWI 
EKRWPGEASR LFDGVGTKRL PGVNWAGVVS LLVGIFATWL FMYGLVPAMQ GPIAVALGGW 
DLSWLAGGVS SAACYAVLGP RVHRKFLAGG AAEPVQVTVP ETTVPEPSAR PSTTAVSL