Gene TM1040_3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3172
Symbol
ID	4075342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	152144
End bp	153709
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	65%
IMG OID	638004675
Product	ASPIC/UnbV
Protein accession	YP_611408
Protein GI	99078150
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.72438
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGGC CTGAGACGTG CGTTTGGCCT GTGGCGGCCC TGTTTGCTTC GGTGGCGCAG 
GCCGACCCGC AGATCCCCAG GTTTACTCCG ATCGAGATGG GTGAACATAT CTACAGCGGC 
GGCTGGGAAC ACTACGTGGG CGGCGGTCTG GCGGTGTTCG ACTGCAACGG CGACGCTCTG 
CCGGAGCTCT ATGCCGCTGG TGGCGAGACC CCGGCCCAGT TGTTCCTCAA CACCTCCGGC 
GCGGACGGCG CGCTTTCTTT TCAGCCGGCC ACGCCCGAGG CGCTGGCCCT GACGGGCGTG 
ACGGGGGCCT ATCCCATCGA CATTGATGGC GACGGCCATC TTGATCTGGC GGTGATGCGG 
GCCGGGACGG ATCTCTTGCT GCAAGGGCAG GGGGGCTGCG CCTTTCACCC CTTTCAGGGA 
CTGGGCTTTC AGAGCGGCGA TCACTGGACC ACGGGTTTTT CCGCCACTTG GGAGGGCGAG 
AACACCCTGC CGACGCTGGC CTTTGGCACC TATGTGGACC GCGCCAACCC CGAAGGGCCG 
TTTGGCACCT GCGATGATAC ACTGCTCTAT CGCCCCAGCG GCGACAAATA CGGCCCCCCC 
GAGGCGCTGT CGCCGGGCTA TTGCGCGCTC TCGGTGCTGT TCAGCGACTG GAACCGCACA 
GGCCGCGCCG ATCTGCGGCT GTCGAACGAC CGGCACTATT ATGTGCGCGG CGGGCAGGAA 
CAGATGTGGG CGATGGAGGC CACCCCGCGG CTCTATACTG AGGCCGAAGG CTGGAAGCCC 
TATGCGCTCT GGGGCATGGG CATCGCCTCG CGCGACATGA ATGGCGACGG GTTTGCGGAT 
GTCTATCTGA CGTCCATGGG CGATCAGAAG TTTCAACTGC GCAACCCCGA GGCCGAGGGG 
CCGGTCTGGG AGGATGTCAC CTATGGGTTT GGCACTACCG CACATCGACC CTATACGGGC 
GGCGATGGGC GCCCCTCGAC CGGCTGGCAC GCAGCCTTTG GCGACGTGAA CAACGACGGG 
CTGGACGATA TTTTTGTGAC CAAGGGCAAC GTGGAACAGA TGCCCGATGC CGCCCAGAAA 
GACCCCAATA ACCTGATGTT GCAGCAACAG GACGGCCTGT TCACCGAAGC CGGCGCAGAG 
GCGGGGATCG CAAGCCTTCA GCGCGGGCGC GGGGGCGCTC TGGTTGATCT CAACCGCGAT 
GGCCTGCTCG ATATGGCGGT GGTCAATCGC CGCGCCCCGC TCGAGGTCTG GCAAAACAGA 
GGCCCCGCGG ATGCGACGGG CGGCAACTGG CTGCTGCTGC GCCTTGGCGC AGAGGGGCCC 
AACCGGGACG CCATCGGCGC CTTTGTCGAA GTCACGGCTG GCGATCGCAC CTACCTGCGC 
GAAGTGACGA TCGGCGGCGG ACATGCAGGC GGCGATCTGG GCGATCTGCA TTTTGGTCTT 
GGCGGGGTGG AAACGGTCGA TCTGCGCGTG ACCTGGCCCG ATGGGCAGGT GTCGGATTGG 
TCGACCGTGA AGGCCAATCA GCGGCTTTTG CTCCGTCCCG GACGCTTGCC GACGCCCGAG 
GACTAA

Protein sequence

MRRPETCVWP VAALFASVAQ ADPQIPRFTP IEMGEHIYSG GWEHYVGGGL AVFDCNGDAL 
PELYAAGGET PAQLFLNTSG ADGALSFQPA TPEALALTGV TGAYPIDIDG DGHLDLAVMR 
AGTDLLLQGQ GGCAFHPFQG LGFQSGDHWT TGFSATWEGE NTLPTLAFGT YVDRANPEGP 
FGTCDDTLLY RPSGDKYGPP EALSPGYCAL SVLFSDWNRT GRADLRLSND RHYYVRGGQE 
QMWAMEATPR LYTEAEGWKP YALWGMGIAS RDMNGDGFAD VYLTSMGDQK FQLRNPEAEG 
PVWEDVTYGF GTTAHRPYTG GDGRPSTGWH AAFGDVNNDG LDDIFVTKGN VEQMPDAAQK 
DPNNLMLQQQ DGLFTEAGAE AGIASLQRGR GGALVDLNRD GLLDMAVVNR RAPLEVWQNR 
GPADATGGNW LLLRLGAEGP NRDAIGAFVE VTAGDRTYLR EVTIGGGHAG GDLGDLHFGL 
GGVETVDLRV TWPDGQVSDW STVKANQRLL LRPGRLPTPE D