Gene Arth_4108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4108
Symbol
ID	4447698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4628077
End bp	4629444
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	67%
IMG OID	639691939
Product	putative secreted protein
Protein accession	YP_833583
Protein GI	116672650
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATC AGCATAGCGT CAATCGCCGC CGCCTTAGAC CCTCTTTTCC TCCACTTCGC 
CCGGCGCGGC GGCCCGGTTT GAGGGTTTCC CCTATCGGCG TTCCGGGAGC GGCGGGACTT 
GCCGTTGCCG CCCTCGTCCT GAGCGCTTGC GCCGCGGACC CGGGGCGGGG CGCTGACGGC 
GCCCAGTCGG GAGGCGGCGC GTCATCCGCC GGGCAGTCCA CCGGGTCGTC CAGTGCAAGC 
CAGGAGGTCC CGGGCCCCGC GCTCAGGCTG GTATTGACTC ATGCCGGGGG CATCACGGTG 
CTCGATGCCA CCTCACTGGA GGTCGTGGGG GAGGCCGAGC TTACGGGCTT CAACAGATTG 
AACCCTGCGG GCGACGGCCG GCATGTCCTG GTGTCCACCG GAAACGCGTT CAGGGTGTTC 
GATGCGGGCG TGTGGACGGA GAAGCATGGT GATCACGGGC ATTCCTACGC CGTTGAGCCG 
TCCCTCACGG CTGCCTCGTT CGAAGCCAGC AAGGCCGGCC ACGCTGTCTT TCATTCCGGC 
CGGACCGCCC TCTTCAGCGA TGGTTCCGGA AAGGTGGAGC TCTTCGACCC GGCAGGACTG 
GGGGAGAGTG CGGGTGTCCT TCCGGACAGT GATGTCTACA CGACTGCGGA AGCCCATCAT 
GGCGTAGCGG TGCCGCTCGA GGCGGGCAAA CTCCTCGTCA CGGTCGGAGA CGAGGAGTCG 
AGGCGGGGGA TTGCCGTGCT GGCAGCGGGA GCGGGGCAGG ACCGCGCGGA ACTGGTGCGC 
AACGAGGACT GCCCCGGCGT GCACGGCGAA GCAGCCGCAG GCCCGGATAC AGTCGTGGTG 
GGCTGTGAAG ACGGCATGCT GATCTACCGG GACGGGAAGA TTTCCAAAGT GGCAAGCCCC 
GACGCCTACG GGCGGATGGG AAACCAGGCG GGTTCGCCCA GGTCGCCGGT GGTTCTGGGT 
GACTACAAAG TGGATAAGGA TGCTGCGCTG GAACGGCCCA CGCGCGTCTC GCTCGTCAAT 
ACGGAGACGG CCACCCTCCG GCTGGTGGAA CTCGGTACGA GCTATTCGTT CCGCTCGCTG 
GGCAGGGGTG CCGCCGGCGA GGCCCTGGTC CTGGGGACCG ACGGCGCCCT GCGTGTCATT 
GACCCATTGA CCGGAAGCAT CACCTCCACC ATCCCCGTCG TTGACGCCTG GGAGGAATCG 
GAAACGTGGC AGGACCCGCG CCCGACGCTG TTTGTGCAGG GCTCCACCGC CTACGTCACG 
GAGCCTGCAG AAAGCGCGAT CCATGCCGTG GACCTTGCCT CGGGCAAAGT AACCAAATCG 
GCGGAACTCG CGCACGTGCC CAACGAGCTG ACGGGAGTCT CGGGCTAG

Protein sequence

MKNQHSVNRR RLRPSFPPLR PARRPGLRVS PIGVPGAAGL AVAALVLSAC AADPGRGADG 
AQSGGGASSA GQSTGSSSAS QEVPGPALRL VLTHAGGITV LDATSLEVVG EAELTGFNRL 
NPAGDGRHVL VSTGNAFRVF DAGVWTEKHG DHGHSYAVEP SLTAASFEAS KAGHAVFHSG 
RTALFSDGSG KVELFDPAGL GESAGVLPDS DVYTTAEAHH GVAVPLEAGK LLVTVGDEES 
RRGIAVLAAG AGQDRAELVR NEDCPGVHGE AAAGPDTVVV GCEDGMLIYR DGKISKVASP 
DAYGRMGNQA GSPRSPVVLG DYKVDKDAAL ERPTRVSLVN TETATLRLVE LGTSYSFRSL 
GRGAAGEALV LGTDGALRVI DPLTGSITST IPVVDAWEES ETWQDPRPTL FVQGSTAYVT 
EPAESAIHAV DLASGKVTKS AELAHVPNEL TGVSG